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Chapter I 


Topologie de R” et fonctions continues 


L’ étude des fonctions d’une variable réelle est un des sujets du cours “Analyse I” (semestre d’hiver). 
Dans ce chapitre, nous discutons des notions qui permetteront une généralisation aux fonctions 
de plusieurs variables. De telles fonctions apparaissent partout en pratique. Par exemple, la 
température dans une salle est une fonction qui dépend de l’espace (trois coordonnées) et du temps. 
Elle est donc une fonction de quatre variables. 

Ce chapitre suit de près la présentation des paragraphes IV.1 et IV.2 du livre “L'analyse au fil 
de l’histoire” de Hairer & Wanner (Springer-Verlag 2002). Pour plus d’informations (remarques 
historiques, démonstrations détaillées, . . .), la lecture de ce livre est vivement conseillée. 


I.1 Distances et normes 


Nous considérons des couples (x1, x2) de nombres réels, et des n-uples (£1, £2, . . . , £n). L'ensemble 
de tous les couples est 


R°'=RXR=#{(71,%2); t1,%2 ER} (1.1) 


et l’ensemble de tous les n-uples est 
R” =R xRx...x R = Moss nt zk ER, k=1,... n}. (1.2) 


Avec l’addition (composante par composante) et avec la multiplication par des nombres réels, cet 
ensemble devient un espace vectoriel (voir le chapitre II du cours “Algèbre [”, semestre d’hiver). 
Les éléments de R” sont donc des vecteurs. Dans ce chapitre, nous ne distinguons pas les vecteurs 
colonnes et les vecteurs lignes. 

Géométriquement, l’espace R? peut être interprété comme un plan; les composantes x et z2 
étant les coordonnées cartésiennes. Par le théorème de Pythagore, la distance d(x,y) entre deux 
points x = (x1, x2) et y = (y1, y2) est donnée par (figure I.1, gauche) 


d(x,y) = y (y1 — 21) + (y2 — 22). (1.3) 


On voit que cette distance ne dépend que de la différence y — x. Ceci justifie l’ écriture ||y — z||2, 
où |lzlla = 4/27 + 22 si z = (21, 22). 

Pour calculer la distance entre x = (£1, £2, x3) et y = (y1, Y2, Y3) dans l’espace RÌ, nous 
appliquons deux fois le théorème de Pythagore (d’abord au triangle DEF et ensuite à ABC, voir 


figure I.1, droite) et nous obtenons d(x, y) = |y — zll2, où [212 = 4/2? + 23 + 23. 
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F = (1: Y2, y3) 


D D = (£1, £2, £ 
Y2 — T2 V3 — T3 (z1, £2, 23) 


k A Y2— T2 a 


Figure I.1: Distances dans R° et dans RÌ 


Dans l’espace R” de dimension n, nous définissons par analogie 


lel = 4/22 +23 +... +22, (1.4) 


et nous appelons cette expression la norme euclidienne de z = (21,22,...,2,). La distance entre 
x € R” et y € R” est alors donnée par d(x, y) = ||y — z |l2. 


Théorème 1.1 La norme euclidienne (1.4) satisfait : 


(N1) lc| >0 et ler 
(N2) lAz|| = JAļ- z| pour AER, 
N3) lz +yl| < [x] + [y (inégalité du triangle). 


Démonstration. Les propriétés (N1) et (N2) sont triviales. La démonstration de (N3) est basée sur 
l’inégalité de Cauchy-Schwarz 

Key) < lell y, (1.5) 
où (x, y) := D, ZkYk désigne le produit scalaire de deux vecteurs x et y (voir le chapitre VI du 
cours “Algèbre I”). L’inégalité du triangle est maintenant une conséquence de 


le +y? = (+y, x+y) = |æ? +2(e, y) + ff < hel? + 2e ll + el? = Gel + y: 
o 


Par la suite, nous utiliserons très rarement la formule explicite de l’ équation (1.4). Souvent, il 
est confortable d’utiliser d’autres expressions satisfaisant les propriétés (N1), (N2) et (N3). 


Définition 1.2 (norme) Une norme sur R” est une application ||- ||: R” — R satisfaisant (N1), 
(N2) et (N3). L'espace R” muni d’une norme s'appelle un espace normé. 


Exemples. En plus de la norme euclidienne (1.4), nous considérons 


nm 

leli = $ les] norme 4, (1.6) 
k=1 

lelo = „max lz] norme maximum. (1.7) 
=1,...,n 


La vérification des propriétés (N1), (N2) et (N3) pour ces normes est facile. La notation (c.-à-d. 
les indices 1, 2, o0) n’est pas choisie par hasard. En effet, les trois normes sont des cas particuliers 
de 


2 1/p 
iE (S r)  nomet, 1<p<o (1.8) 
k=1 


et [xl = lim, ||z|lp- 
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Théorème 1.3 Pour tout x € R”, on a 


lelo < llel < llel <” lello. (1.9) 


Démonstration. Nous ne démontrons que la deuxième inégalité. En prenant le carré |[x||? dans 
l'équation (1.6), nous obtenons la somme des carrés Y` x? (c’est-à-dire ||x||Ż) et les produits mixtes 
|zp| - |z|, tous non négatifs. Ceci implique que |x|? > |x|[2. m 


Ce résultat montre que les normes |x|1, |æll2 et ||x|| sont équivalentes dans l’esprit de la 
définition suivante. 


Définition 1.4 (équivalence de normes) On dit que deux normes || - ||, et || + ||, sont équivalentes 
s’il existe des constantes positives C et C2 telles que 


Ci [rl < Irlla < C2 It] pour tout x €R”. (1.10) 


I.2 Convergence de suites de vecteurs 


Au cours “Analyse [”, nous avons vu des suites de nombres réels ainsi que les notions de conver- 
gence, de suites de Cauchy, etc. Il s’agit maintenant d’étendre ces définitions et résultats à des 
suites de vecteurs. Nous considérons donc {x;};>1, où chaque x; est un vecteur, c.-à-d. 


Hbc... los. (2.1) 


Définition 2.1 (convergence de suites de vecteurs) On dit que la suite {x;};>1, donnée par (2.1), 
converge vers le vecteur a = (a1,a2,...,an) € R” si 


Ve>0 2N>1 Vi>N r-al<e. 


Comme pour des suites dans R , nous écrivons x; — a ou bien lim x; — a. 
41—0 
La seule différence par rapport à la définition pour des suites de nombres réels est que les 
“valeurs absolues” sont remplacées par des “normes”. 
La figure I.2 montre la suite x; = (0.6 + 0.56 r cos(0.6 + 0.7 i) , 0.4 + 0.4r'sin(0.6 + 0.7i)) 
dans R° avec r = 0.86. Elle converge vers a = (0.6, 0.4). 


DT arr * T2 
Tga om, +73 | .* | 
| * 
i * j 
Qo f RE 

soo Ta 

Î | |o 
$ + * ' 


us = SES — ‘aus » 
T13 12 di Zi 


Figure I.2: Illustration d’une suite convergente dans R? 
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Attention Dans la définition 2.1, nous n’avons pas encore précisé quelle norme il faut prendre. 
Nous observons que si || - ||, est équivalente à || - ||,, alors on a 


convergence avec | - |, <= convergence avec ||- ||. (2.2) 


En effet, |x; — all, < £ et (1.10) impliquent que |x; — all, < C2e. Puisque € > 0 est arbitraire 
dans la définition 2.1, nous pouvons le remplacer par £’ = Coe, et nous voyons que la convergence 
avec ||- ||}, implique celle avec || : ||,. 

Nous savons déjà (théorème 1.3) que ||- ||1, I|- | et ||- || sont équivalentes ; nous verrons plus 
loin (théorème 4.6) que toutes les normes dans R” sont équivalentes. Par conséquent, on peut se 
servir de n’importe quelle norme dans la définition 2.1. 


Théorème 2.2 (critère de convergence) Pour une suite de vecteurs (2.1), on a 


lim x; = a < lim zki =aķp pour k=1,2,..., n, 
i— 00 i—00 
i.e. la convergence dans R” est équivalente à la convergence composante par composante. 
Démonstration. Prenons la norme maximum (1.7) pour laquelle 
lm=aliée 4 |tri— a| <E pour k= 1,2,...,n. 


Avec cette norme dans la définition 2.1, le résultat est immédiat. O 


Avec l’observation qu’il faut seulement remplacer “valeurs absolues” par “normes”, on peut 
étendre beaucoup de définitions et résultats du cours “Analyse I” à une dimension supérieure. Par 
exemple, nous disons qu’une suite des vecteurs {x;};-1 est bornée, s’il existe un nombre B > 0 tel 
que |x;|| < B pour tout à > 1. De nouveau, la propriété d’être bornée ne dépend pas de la norme 
choisie. Comme dans R, nous voyons que toute suite convergente est bornée. 

On dit qu’une suite {x;};-1 est une suite de Cauchy si 


Ve>0 AN>1 V>N Ve>1 |r; — zrul <e. (2.3) 


En utilisant la norme maximum dans (2.3), on constate que cette définition est équivalente au fait 
que, pour k = 1,...,n, les suites réelles {x,;};-1 sont des suites de Cauchy. Par conséquent, nous 
obtenons directement la généralisation du critère de Cauchy. 


Théorème 2.3 (critère de Cauchy dans R”) Une suite de vecteurs dans R” est convergente si et 
seulement si elle est une suite de Cauchy. m 


Le théorème de Bolzano-Weierstrass reste aussi vrai dans R”. Sa démonstration, par contre, 
nécessite quelques idées supplémentaires. 


Théorème 2.4 (Bolzano-Weierstrass dans R”) Chaque suite bornée de vecteurs dans R” admet 
une sous-suite convergente. 


Démonstration. Soit {x;};-1 une suite bornée dans R”. La suite de ses premières composantes 
{z1 };>1 est bornée et on peut appliquer le théorème de Bolzano-Weierstrass dans R. Elle admet 


alors une sous-suite convergente, disons 


TZ1,1; dis, Cros 1,22, Dir 1,58; T1,238; T1,576; --- à (2.4) 
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Passons aux deuxièmes composantes. L’idée essentielle est de ne considérer que celles qui corre- 
spondent à la sous-suite (2.4) et non pas celles de la suite toute entière. Cette suite est bornée, et 
nous pouvons de nouveau appliquer le théorème de Bolzano-Weierstrass dans R pour obtenir une 
sous-suite convergente, disons, 


T21, T29, L258; T2576; =- (2.5) 


Maintenant, les premières et les deuxièmes composantes de la suite £1, To, £58, £576, ... CONVET- 
gent. Pour n = 2, la démonstration est terminée. Pour n > 2, nous examinons les troisièmes 
composantes avec des indices correspondant à (2.5), et ainsi de suite. Après n étapes, il reste une 
suite dont toutes les composantes convergent. m 


I.3 Voisinages, ensembles ouverts et fermés 


Pour des ensembles A et B dans R”, nous utilisons les notations 


ACB si les éléments de À appartiennent à B (sous-ensemble), 
ANB={xEeR":xeAÀ et xe B} (intersection), 
AUB = {xeR";:xeA ou xeB} (réunion ou union), 
A\B={xeR";xeA mais xg B}, (différence), 

CA = {x ER"; x gA} (complémentaire). 


Le rôle de l’intervalle ouvert est joué par 
B.(a) = {x ER"; |z -al <e}, (3.1) 


appelé disque (ou boule) de rayon € et de centre a (voir la figure I.3). 


+ © 


Pp = © 


Figure I.3: Disques de rayon € = 1, 1/2, 1/4 pour ||z|j1, [x]: et ||, 


Définition 3.1 (voisinage) Soit a € R” donné. Un voisinage de a est un ensemble V C R” qui 
contient un disque de rayon positif centré en a, i.e., 


V est voisinage de a <> J3 >0 B(la)cCV. 


Le disque B, (a) dépend de la norme utilisée (|| - ||, ||- I2 ou ||: 
loo; - - -) ; la définition d’un voisinage, par contre, est indépendante / 
de la norme utilisée, à condition que les normes soient équivalentes. ) 
Chaque B.(a) pour une norme contient un By (a) pour l’autre bé 
norme (voir le dessin à coté). 


Définition 3.2 (ensemble ouvert) Un ensemble U C R” est ouvert s’il est un voisinage de chacun 
de ses points, i.e. 


U ouvert — MEL J3e>0 GET 
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Définition 3.3 (ensemble fermé) Un ensemble F C R” est fermé si chaque suite convergente 
{ti}i>1 avec x; € F a sa limite dans F, i.e. 
F fermé <> a= Jim x; et x, EF impliquent a€ F. 
OO 

Exemples dans R. 

L’intervalle dit “ouvert” (a, b) = {x ER ; a < x < b} est un ensemble ouvert. En effet, pour 
un x € (a,b), le nombre € := min(x—a,b—x) est strictement positif, et nous avons B. (x) C (a,b). 
Par contre, la suite {a + 1/i} (pour à > 1) est convergente, ses éléments sont dans (a, b) à partir 
d’un certain i, mais la limite n’est pas dans (a, b). Donc, l’ensemble (a, b) n’est pas fermé. 

L'ensemble dit “fermé” [a,b] = {x € R ; a < x < b} est fermé (faire la démonstration à 
l’aide d’un théorème du cours “Analyse I’). Cependant, ni a ni b n’ont un voisinage entièrement 
inclus dans |a, b]. L’intervalle fa, b] n’est donc pas ouvert. 

L’intervalle A = |a, b) n’est ni ouvert ni fermé, puisque a n’a pas de voisinage dans fa, b) et la 
limite de la suite convergente {b — 1/i} n’est pas dans |a, b). 

Enfin, l’ensemble R = (—co, +00) est ouvert et fermé, ainsi que l’ensemble vide f. 


Lemme 3.4 Soit || - || une norme arbitraire de R”. 


a) L'ensemble A= {x E€ R” ; |x| <1} est ouvert. 


b) L'ensemble A= 4x E€ R” ; [x] <1} est fermé. 


ON CON 


Figure I.4: Ensembles ouverts {x ; ||x||p < 1} (gauche) et fermés {x; ||x||p < 1} (droite) 


Démonstration. a) Pour a € À prenons € = 1 — ||a|| qui est positif. Avec ce choix, nous avons 
B.(a) C A (voir figure I.4, gauche). En effet, par l’inégalité du triangle, nous avons pour x € 
B.(a) 

If = Îx-a+al< |æ -al+ dal <e+llal = 1. 


Donc, À est ouvert. 
b) Considérons une suite {x;};>1 vérifiant x; € A (pour tout i) et convergeant vers a. L’inégalité 
de triangle implique 


lal = |z: = zi + al < fill + z: — al < 1+ ui - al <1+e 
pour i > N. Ceci est vrai pour tout € > 0. Par conséquent, ||a|| < 1 et A est fermé. o 


Autres exemples. 

Le demi-plan À = {x € R°; t%1+% > 2} est un ensemble ouvert; par contre, le demi-plan 
A = {x E€ R°; x1+72 > 2}estun fermé (même démonstrations que tout à l’heure). On verra plus 
tard que l’ensemble A = {x € R? ; f(x1, £2) > 0} est ouvert et que À = {x € R? ; f(x1,%2) > 
0} est fermé si f (£1, £2) est une fonction continue. 
L'ensemble A = {x € R? ; 21, 22 € Q, ||x|| < 1} n’est ni ouvert ni fermé, car chaque disque 
contient des points irrationnels; et une limite de points rationnels peut être irrationnelle. 
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Le célèbre ensemble de Cantor (figure I.5) est donné par 


A = [0,1] \ {(1/3, 2/3) U (1/9. 2/9) U (7/9,8/9) U ...} = [z s= at, a € {0,2} }. 


(3.2) 
Cet ensemble n’est pas ouvert (par ex. x = 1/3 n’a pas de voisinage dans A) mais il est fermé (voir 
la remarque après la démonstration du théorème 3.6). 


O I M I 
0 1/9 1/3 2/3 1 


Figure I.5: Ensemble de Cantor 


Le triangle de Sierpiński et le tapis de Sierpiński (figure I.6) sont des généralisations bidimen- 
sionnelles de l’ensemble de Cantor. Ces dessins ne nous plaisent pas seulement par leur beauté, 
mais nous rappellent que les ensembles peuvent être des objets bien compliqués. 


Figure I.6: Triangle de Sierpiński et tapis de Sierpiński 


Théorème 3.5 On a 
1) F fermé —> CF ouvert, 


ii) U ouvert => CU fermé. 

Démonstration. i) Supposons que LF ne soit pas ouvert. Il existe alors un a € CF (i.e. a & F) 
tel que, pour tout £ > 0, on ait B.(a) ¢ CF. En prenant € = 1/i, nous pouvons choisir une suite 
{xi};>1 satisfaisant x; € F et |[x; — aļ|| < 1/i. Comme F est fermé, nous obtenons a € F, d’où 
une contradiction. 

ii) Supposons que CU ne soit pas fermé. Il existe alors une suite x; € CU (i.e. x; & U) 
convergeant vers un a & LU, (i.e. a € U). Comme U est ouvert, nous avons B.(a) C U pour un 
certain € > 0. Par conséquent, x; ¢ B.(a) pour tout à, d’où une contradiction. m 


Théorème 3.6 Pour un nombre fini d'ensembles, on a 
1) U1, U2,..., Um ouverts => UNUN... NUm est ouvert, 


i) Fi, Fo,..., Fm fermés => FURU... U Fm est fermé. 
Pour une famille arbitraire d’ensembles (indexée par l’ensemble À), on a 


ii) U, ouvert pour tout À} = (JA Ua = {x ER"; HE A, x € U;} est ouvert, 


iv) F\ fermé pour tout À = (hea Pa = {x E€ R” ;VA € A, x € Fy} est fermé. 
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Démonstration. Commençons par la démonstration de (1). Soit x € U1 N ... N Um, donc x € Uk 
pour tout k = 1,...,m. Comme U; est ouvert, il existe un £ > 0 tel que B., (x) C Up. Prenons 
E€ = min(£1,...; Em) i alors € > 0 et B.(x) C U1 N... N Um- 

La démonstration de (iii) est encore plus simple ; nous l’omettons. Les équivalences (1) & (ii) 
et (iii) (iv) sont une conséquence des “règles de Morgan” 


C(U N V2) = (CU) U (C03), C(U1 U U2) = (CU) N (LUE), 


et du théorème 3.5. o 


Remarque. Ce théorème nous permet de démontrer que l’ensemble de Cantor défini par (3.2) est 
fermé. En effet, son complémentaire 


CA = (—00, 0) U (1,00) U (1/3, 2/3) U (1/9, 2/9) U (7/9, 8/9) U 


est une union infinie d’intervalles ouverts. Le théorème 3.6 implique donc que À est fermé. 


2-0 


Figure I.7: Ensembles ouverts d’intersection fermée (gauche) et ensembles fermés d’union ouverte 
(droite) 


Remarque. Les affirmations (i) et (ii) du théorème 3.6 ne sont, en général, pas vraies pour un 
nombre infini d’ensembles. 
Considérons par exemple la famille d’ensembles ouverts 


(1.26) U: = {a eR?; [el <1+1/6}, 
dont l'intersection Uz N Uz N U4 N... = {x € R? ; [rx] < 1} n’est pas ouverte (figure I.7, 
gauche). 


De façon analogue, la famille d’ensembles fermés (figure I.7, droite) 
(1.27) F= frER?; lel <1- 1/i}, 


a une union Fz U F3 U F4 U... = {x € R° ; |x| < 1} qui n’est pas fermée. 
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I.4 Fonctions continues 
Soit À un sous-ensemble de R”. Une fonction 
f:A—R" (4.1) 


envoie le vecteur x = (71,...,%,) € À sur le vecteur y = (y1,...,Ym) € R™. Chaque com- 
posante de y est une fonction de n variables. Nous écrivons alors 


Yı = fi(t1,-.., En) 
y = f(x) ou (4.2) 


LEO 0 
| ANT het LU, 
\ NS 01 4 
NN ECO X X 

X X% 


CEEOL 
SSSL 


Figure I.8: Paraboloïde (gauche) et hélice (droite) 


Exemples 

a) Une fonction (m = 1) de deux variables (n = 2) peut être interprétée comme une surface 
dans R°. Par exemple, la fonction y = z? + x? représente un paraboloïde (figure I.8, gauche). 

b) Deux fonctions (m = 2) d’une variable (n = 1) représentent une courbe dans R3. Par 
exemple, l’hélice de la figure I.8 (droite) est donnée par yı = cos 10x, y2 = sin 10x. Si nous 
projetons la courbe sur le plan (y1, y2), nous obtenons une “représentation paramétrique” d’une 
courbe dans R? (un cercle dans cet exemple). 


Définition 4.1 (continuité) Une fonction f : A — R”, A C R” est continue en xo € À si 


Ve>0 4>0 VreA:x-20|<ô |f) — f(x) < E€. 


C’est précisément la définition de la continuité d’une fonction à une variable avec les valeurs 
absolues remplacées par des normes. Cette définition ne dépend pas des normes choisies, pourvu 
qu’elles soient équivalentes. En utilisant la norme maximum dans R”, nous obtenons le résultat 
suivant (à comparer avec le théorème 2.2). 


Théorème 4.2 Une fonction f : A — R”, À C R” donnée par (4.2) est continue en xo € A si et 
seulement si chaque fonction fj : A — R est continue en zo (j = 1,..., m). m 
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Une conséquence de ce théorème est qu’il suffit de considérer le cas m = 1 pour l’étude de la 
continuité. 

Il est évident qu’une fonction constante f(x) = c est partout continue. La projection de x = 
(t1,...,%,) Sur sa kième coordonnée, i.e. p(x) = zp, est également continue en chaque point 
£o = (£10, . . . , Eno), puisque [tx — xxol < |x — zol] (choisir ô = € dans la définition 4.1). 

Comme pour des fonctions à une variable, on démontre que le produit et le quotient (si le 
dénominateur est non nul) de fonctions continues est continue. Par conséquent, les polynômes en 
plusieurs variables, par exemple f (£1, £2, £3) = 273 — xıx3zz + 4x3 — 1, sont partout continus; 
et les fonctions rationnelles sont continues aux points où le dénominateur est non nul. 


Figure I.9: Stéréogramme de la fonction discontinue f (x1, x2) de la formule (4.3) (tenir le dessin à 
20 cm des yeux et “loucher” à travers le papier vers un objet situé 20 cm derrière. Alors, les deux 
dessins fusionnent et un dessin 3D apparaît.) 


Exemple 4.3 Considérons la fonction f : R? — R donnée par 


dn si z? +r? >0 
f(t, t2) = & 2? +a? eg (4.3) 
0 si zı = Lo = 0 


(voir figure I.9). Comme elle est une fonction rationnelle, elle est certainement continue aux points 
vérifiant x?+x3 > 0. Pour expliquer son comportement près de l’origine, utilisons les coordonnées 
polaires xı = r cos @, x2 = r sin @ ; il vient (pour r > 0) 


r?°cospsingp 1 


f(rcoso, rsing) = -2 = z sin 24. 


Par conséquent, la fonction est constante sur les droites passant par l’origine, et cette constante 
dépend de l’angle y. Dans tout voisinage de (0, 0), la fonction (4.3) prend toutes les valeurs entre 
+1/2 et —1/2. Elle ne peut donc pas être continue en (0, 0). 


Définition 4.4 (ensemble compact) Pour un ensemble K C R", on dit que 
K est compact <> K est borné et fermé. 


Beaucoup de résultats pour des fonctions continues à une variable possèdent une généralisation 
à plusieurs variables. Un résultat qu’on obtient de nouveau en remplaçant “valeurs absolues” par 
“normes” est le suivant. 


Théorème 4.5 Soit K C R” un ensemble compact et soit f : K — R continue sur K. Alors, f 
est bornée sur K et admet un maximum et un minimum, i.e. il existe u € K et U € K tels que 


flu) < f(x) < (U) pour tout xEK. m 
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Ce théorème conduit au résultat suivant, déjà annoncé au début de ce chapitre. 


Théorème 4.6 (équivalence de normes) Toutes les normes dans R” sont équivalentes. C'’est-à- 
dire que si N : R” — R est une application satisfaisant les conditions (N1), (N2) et (N3) du 
théorème 1.1, i.e. 


N1) N(z)>0 et N(x)=06&zr=0, 
N2) N(Ax) =JA| N(x) pour AER, 


(N3) N(x+y)<N(x)+ N(y) (inégalité du triangle), 
alors il existe des constantes Cı > 0 et C2 > 0 telles que 


Ci xl < N(x) < Cə [xlb pour tout x ER”. (4.4) 


Démonstration. a) Écrivons z = Tie1 + £2€2 + ... + Znen, dans la base canonique e; = 
(1,0,...,0), e2 = (0,1,0,...,0), etc. On déduit de (N3), (N2) et de l'inégalité de Cauchy- 
Schwarz (1.5) que 


N(x) = N(ziei +... Piel < Mie: +... +N (nen) (4.5) 
< fil: N(e1) +--+ |En]: N (en) < fil: C2, | 
avec C2 = yN (e1)? +... + N(en)?. La deuxième inégalité de (4.4) est ainsi démontrée. 


b) Montrons ensuite que N (x) est continue (avec la norme euclidienne dans la définition 4.1). 
On a 


N(x) — N(xo) = N(x — £o + to) — N (z0) < N(x — zo) + N (z0) — N (z0) < C2][x — xoll2 
et, de la même façon, N (xo) — N(x) = ... < Cə||£o — x|2. On en déduit que 
IN (x) — N(xo)| < Cox — ollz 


ce qui implique la continuité de N (x). 
c) Considérons la fonction N (x) sur l’ensemble compact K = {x € R”; |x|2 = 1}. Parle 
théorème 4.5, elle admet un minimum en un u € K, c.-à-d. il existe u € K avec 
Nu) < N(2) pour tout 2€ K. 


Posons C1 := N (u) ; par (N1), on a Ci > 0. Comme z/||x||2 € K pour tout x € R” (x # 0), 
nous avons 


Ci = N{u) < N( - ) Les 


læl2/ æl 
ce qui démontre la première inégalité de (4.4). m 


I.5 Convergence uniforme et la courbe de Peano-Hilbert 


Toutes les définitions et les résultats du cours “Analyse I” concernant la convergence uniforme 
d’une suite de fonctions se généralisent immédiatement à plusieurs dimensions. Rappelons qu’une 
suite de fonctions fx : A — R™, A C R” converge uniformement sur A vers f : A — R”, si 


Ve>0 2N2>1 Vk>N VreA f(x) — f(a)I <e. 


Un exemple est le suivant. 


Théorème 5.1 Si une suite de fonctions continues f, : À — R”, A C R” converge uniformément 
sur À vers une fonction f : À — R”, cette fonction limite est continue. m 
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La courbe de Peano-Hilbert L'image d’une fonction continue 4 : [0,1] — R? est une courbe 
dans R?. Par exemple, la fonction y(t) = (t,1 — t) donne un segment de droite et la fonction 
p(t) = (cos 2rt,sin 27t) un cercle. On peut se demander si l’image d’une fonction continue 
p : [0,1] — R? peut remplir tout le carré [0,1] x [0,1]. Peano (1890) et Hilbert (1891) ont 
découvert que ceci est possible: on divise chaque carré en quatre sous-carrés et on étiquette leurs 
centres récursivement, en suivant la direction de la courbe précédente (voir la figure I.10). 
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Figure [.10: La courbe de Peano-Hilbert 


Une autre construction. Soit p(t) = (x(t), y(t)), 0 < t < 1 une courbe continue arbitraire reliant 
les points A = (0,0) pour t = 0 et B = (1,0) pour t = 1 (voir la figure I.11). Nous définissons 
alors une nouvelle courbe ®ọ par 


z(u (4t), x(4t)) si 0<t<į 

J 4(æ(4t-1),1+y(4t-— 1)) sil<i<?2 
(Bo)(t) = 1(+x(4t—2),1+y(4t—2)) si 2<t<5 
50 y(dt —3),1—zx(4t—3)) si 3< t<1. 


Ainsi, nous avons à nouveau une courbe continue reliant A = (0, 0) pour t = 0 et B = (1, 0) pour 
t = 1 (voir le deuxième dessin de la figure I.11), et ainsi ce procédé peut être répété (troisième 


E) 


A BA BA 
Figure [.11: Création de la courbe de Hilbert 
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dessin dans la figure [.11). Ceci définit une suite de fonctions yọ = 4, yı = 0, Y2 = Pt, etc. 
Si nous commençons avec une autre courbe initiale y(t) avec ||p(t)—yY(t)llo < K pour t € [0,1], 
alors |Po(t) — Py(t)|x < K/2 (voir la figure 1.11). Par conséquent, 


leE) — DCE) K 2, (5.1) 


et, en prenant Y(t) = Ym(t) et K = 1, ona 


l(t) — Prim ltl] < 27. (5.2) 


Par (5.2), la suite y(t) converge uniformément (critère de Cauchy), et possède donc une lim- 
ite continue Yæ(t) (théorème 5.1). De plus, nous voyons avec (5.1) que la fonction limite est 
indépendante de la fonction initiale o(t). 


Remarque. Il est intéressant de mentionner que les deux coordonnées x(t) et y(t) sont des 
exemples de fonctions continues, nulle part différentiables (sans démonstration). 


I.6 Exercices 


Chapter II 


Calcul matriciel 


Les fonctions linéaires sont des exemples très simples de fonctions à plusieurs variables, mais elles 
sont également très importantes. Nous verrons dans le chapitre III que beaucoup de fonctions (en 
fait toutes les fonctions différentiables) peuvent être localement approximées par des fonctions 
linéaires. 


IL1 Rappel de l’algèbre linéaire 


L'espace R” est un espace vectoriel, c.-à-d. qu’on peut additionner ses éléments et on peut les 
multiplier par des scalaires À € R. 


Base canonique Chaque vecteur x € R” peut être écrit (de manière unique) comme 


1 0 0 

s l 0 
£ = L11 + Lao +... + EnEn où aes]. þh es]. él le aD 

0 0 1 
On appelle x1, £2,..., x, les composantes ou coordonnées du vecteur x et l’ensemble des vecteurs 
{e1, e2,..., €n} la base canonique de R”. Dans ce chapitre nous écrivons les vecteurs de R” 


comme des vecteurs colonnes. 


Applications linéaires Une application linéaire est une fonction f : R” — R”™ satisfaisant 
fete fi fly) JO) = AE) pourtout x,y ER”, AER. (1.2) 
En notant l’image de e; par f (ej) = A; = (aij, @2;,..., &mj)', la linéarité de f(x) implique que 
f(x) = f(z1e1 +... + Enen) = mer A = AT 


où À est la matrice dont les colonnes sont A4, .. ., An. Celle-ci est une matrice m x n (m lignes et 
n colonnes). Le produit Ax est donné par 


Qil ‘‘'" Ain Tı d11T1 ee T Ainln 
Az= |: : |= 


Am1 t Amn Trn Am1Tı | Amnn 


Chaque application linéaire peut donc être écrite sous la forme f(x) = Ax où A est une matrice 
MXN. 
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Bases arbitraires Un ensemble { 51, S2,..., Sn} de n vecteurs est une base de R” si S1, S2,..., Sn 


sont linéairement indépendants. Chaque x € R” peut être écrit de manière unique comme 


où S est la matrice n x n dont les colonnes sont les $;, et £ est le vecteur de composantes £; (voir la 
figure II.1). On appelle alors £1, &2,..., En les coordonnées de x selon la base {51, S2,...,5,}. 


Comme S est une matrice inversible, la relation (1.3) donne une bijection entre x et £. 


Figure IL. 1: Représentation de x dans la base canonique (gauche) et dans la base {S:, S2} (droite) 


Changement de coordonnées Considérons une application linéaire f : R” — R” donnée par 
x y = Ar où À est une matrice m x n. Si l’on change les coordonnées dans l’espace de départ 
R”, (x = S£) et dans l’espace d’arrivé R™ (y = Tr), l application 


y = Ax devient n=T ASE. 


devenir très simple. En particulier, on peut toujours trouver S et T tels que 


Li Ty 0 
rias- (5 2) 
où J, designe la matrice unité de dimension r (voir le paragraphe II.7 du polycopié du cours 
“Algèbre IT”). C’est-à-dire que dans les nouvelles coordonnées l’application y = Ax devient sim- 
plement n; = &; pour i = 1,...,r etn; = O pouri =r +1,..., m. 

Si f : R” — R” est une application où les espaces de départ et d’arrivée sont identiques, on 
est interessé à faire le même changement de coordonnées pour x et y, i.e., x = SE et y = Sn. Dans 
cette situation, l’ application devient 7 = STŻAS £ et on cherche une transformation S telle que la 
matrice S—!AS soit plus simple que A. 


Avec des bases S = (S1,..., Sn) et T = (Tı, ..., Tm) bien choisies, la matrice T7!AS peut 


Valeurs et vecteurs propres Pour transformer une matrice n x n en une forme simple, les valeurs 
propres et les vecteurs propres jouent un rôle important. On dit que À € C est une valeur propre 
de la matrice À s’il existe un vecteur v € C”, v Æ 0 tel que 


Av = Àv. (1.4) 


Un vecteur v 0 satisfaisant (1.4) s’appelle vecteur propre de A correspondant à la valeur pro- 
pre À. Pour que À soit une valeur propre de À, il faut que le système linéaire (A — AI\w = 0 
possède une solution non nulle. Par conséquent, À doit nécessairement être un zéro du polynôme 
caractéristique 

XA(A) := det(A — AT). (1.5) 
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Matrices à coefficients complexes La considération des valeurs et vecteurs propres d’une matrice 
nécessite de travailler avec l’espace C” des n-uples de nombres complexes. Celui-ci est également 
un espace vectoriel mais cette fois sur C (on peut additionner les éléments de C” et on peut les 
multiplier par des scalaires À € C). 

La base canonique de C” est la même que pour R”. Les applications linéaires f : C” — C™ 
sont de nouveau de la forme f(x) = Ax où cette fois les coefficients a;; de la matrice À sont 
des nombres complexes. Une base de C” est donnée par n vecteurs linéairement indépendants et 
un changement de coordonnées s’exprime de nouveau par les formules x = SE, y = Tn tel que 
y = Ax devient 7 = T'AS £. Ici, toutes les matrices sont à coefficients complexes. La définition 
de valeurs et vecteurs propres ne change pas par rapport à R”. 

Pour un nombre complexe À = a + iĝ, son conjugé est donné par À = a — iĝ et le carré de 
sa valeur absolue est |A|? = À: À = a? + 8?. Pour un vecteur x € C” et pour une matrice A 
à coefficients complexes, on dénote par x et À les objets où tous les éléments sont remplacés par 
leur conjugé. Le vecteur transposé conjugé T° est noté x* et, similairement, la matrice transposée 
conjugée de A est A* :— À". Elle s’appelle aussi matrice adjointe de À. 

Si l’on identifie C avec R? (a + iĝ + (a, 6)), la valeur absolue du nombre complexe œ + 
iB correspond à la norme euclidienne du vecteur (a, 8). En identifiant C” avec R°*, on peut 
introduire une norme sur C” 


lell = la +... + [enl = 4/22 + y? +... +a2 + y2 (1.6) 


si z = (21...,2) et zj = zj + iyj. Les propriétés (N1), (N2) et (N3) du théorème I.1.1 restent 
vraies et on a | Ax|| = |A] : ||x|| pour tout x € C” et À € C. En définissant le produit scalaire de 
deux vecteurs x, y € C” par 


CAD LED NU (1.7) 
j=1 


on obtient ||x|| = 4/(x.x) et l'inégalité de Cauchy-Schwarz (1.1.5) reste vraie dans C”. 


IL2 Forme normale de Schur 


Considérons une application linéaire y = Ax où A est une matrice carrée de dimension n à co- 
efficients réels ou complexes. Le but de ce paragraphe est de simplifier A en utilisant un change- 
ment de coordonnées y = Sn, x = SE (deux fois la même matrice S) qui laisse la distance 
entre deux vecteurs invariante (isométrie). Ceci signifie qu’on demande d(Sx, Sz) = d(x,z) ou 


[Sx — Sz|| = ||x£ — z|| ou (x — 2)*S*S{x — z) = (x — z)" (x — z). 


Définition 2.1 (matrices orthogonales et unitaires) Une base {S1,...,S,} de R” ou de C” est 
une base orthonormale si ||S;|| = 1 pour tout j et si (Sj, Sk) = 0 pour j £ k. 

Une matrice carrée S à coefficients réels s'appelle orthogonale si StS = I. 

Une matrice carrée S à coefficients complexes s'appelle unitaire si S*S = I. 


Ces transformations sont extrêmement importantes pour un calcul sur ordinateur parce qu’elles 
n’amplifient pas les erreurs d’arrondi (voir le cours “Analyse Numérique”, 2ème année). 

Remarquons encore que le produit de matrices orthogonales (resp. unitaires) est orthogonal 
(resp. unitaire) et qu’on a S7} = St pour des matrices orthogonales et S1 = S* pour des matrices 
unitaires. 
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Exemple 2.2 Toutes le matrices orthogonales de dimension 2 sont données par 


U, 2 a e Ši U E Er a , (2.1) 


sin Q Cos Q sin& —Cos a 


La transformation avec la matrice U, correspond à une rotation d’angle a (observer det U, = 1), 
celle avec U> est une réflexion suivi d’une rotation (det U> = —1). 
Des exemples de matrices orthogonales de dimension 3 sont 


1 0 0 cos BG 0 sing cosy —siny 0 
Ri(a)=| 0 cosa -sina Rə(6)= 0 1 0 R3(y)= | siny cosy 0 
0 sina cosa —sinf 0 cosÿ 0 0 1 


Chaque matrice orthogonale de dimension 3 avec déterminant égal à +1 peut être écrite sous 
la forme U = R3(p)R2(0)Rs(Ņ) (sans démonstration). Les trois angles ọ, 0, 1 s'appellent les 
“angles d’Euler” de la rotation dans R3. 


Théorème 2.3 (forme normale de Schur, version complexe) Soit A une matrice n x n à coeffi- 
cients réels ou complexes. Il existe une matrice unitaire U (i.e., U*U = I) telle que 


A ko  *% 
taoeu ana. A2 (2.2) 
Er: 
est triangulaire avec les valeurs propres à, ..., An de A sur la diagonale. 


Démonstration. Soit À, un zéro du polynôme caractéristique (1.5) et v un vecteur propre corre- 
spondant. Choisissons une matrice unitaire U; dont la première colonne est vı (procédé d’orthonormalisation 
de Gram-Schmidt, voir le paragraphe VI.1 du polycopié du cours “Algèbre I”). Avec cette matrice 


on obtient 
à St ; : à s 
AU = à) i.e. van= (y x) 


où B est une matrice (n — 1) x (n — 1). Supposons, par récurrence sur la dimension de la matrice, 
qu’il existe une matrice unitaire U telle que U*B U est sous forme triangulaire. Alors, avec la 


matrice unitaire 
U := U. l l 
~ilo U 


Base CD, COIN MEN A D No fe 0 
vrau = ( 8) nie 8) =( 550) 


qui est sous la forme souhaitée. m 


on obtient 


On appelle une matrice À normale si A*A = AA*. Pour une matrice à coefficients réels ceci 
signifie que AtA = AAt. Des exemples de matrices normales réelles sont les matrices symétriques 
(At = A) ou anti-symétriques (At = —A). Pour des matrices normales, le théorème précédent 
donne une matrice diagonale. 
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Corollaire 2.4 Soit A une matrice normale (i.e., A* A = AA*). Il existe alors une matrice unitaire 
U telle que 
UAU = U*AU = diag ass 


Démonstration. Soit U la matrice unitaire obtenue par le théorème 2.3 et soit S la matrice trian- 
gulaire de (2.2). Comme A est normale, on a 


PS (U AUU AD) EU A OU AU SUA AU SUAN U cnag 


c.-à-d. S est aussi normale. Cette condition implique que la norme de la jème colonne de S est 
égal à la norme de sa jème ligne. Pour j = 1, ceci implique que tous les éléments de la première 
ligne de (2.2) sont nuls sauf celui sur la diagonale. Ensuite on considère j = 2 et on déduit de 
la même manière que les éléments de la deuxième ligne en dehors de la diagonale sont nuls. En 
continuant ce raisonnement, on obtient le résultat. o 


Traitons maintenant le cas où A est une matrice à coefficients réels. Il est impossible de trouver 
sans restriction une décomposition de la forme (2.2) à l’aide d’une matrice orthogonale U. Ceci 
impliquerait que les À; soient réels et donne ainsi une contradiction. 


Théorème 2.5 (forme normale de Schur, version réelle) Soit A une matrice n X n à coefficients 
réels. Il existe une matrice orthogonale U (i.e., UtU = I) telle que 


A ko ooe x 
UAU =U'AU = | ° Aa (2.3) 
: E . * 
D: 4e 0 An 


. ; . i . | Qj i/ Vj . ; 
où À; est soit la matrice (à;) de dimension 1, soit la matrice ( , ; Psl . de dimension 2. 
HIFI j 
Les valeurs propres de A sont À; et aj + ifj. 


Démonstration. Nous suivons la démonstration du théorème 2.3. 

Si À est une valeur propre réelle de À, on peut choisir le vecteur propre v; tel qu’il soit réel 
et de norme 1. En construisant une matrice orthogonale U, dont la première colonne est vı, la 
première colonne de U+ A U; est sous la forme souhaitée. 

Soit alors À = à + iĝ avec 5 Æ 0 et vı = u + iw. On peut supposer utw = 0 car, sinon, on 
considère (1+iu)(u+iw) = (u—yw)+i(uu+w) qui est aussi un vecteur propre et on détermine y 
afin que (u— pw) L (pu+w). Ceci donne l’équation quadratique p?utw+p(|lw| —|}u||)—utuw = 0 
qui possède toujours une solution réelle. Avec u1 := u/|u|, wı := w/|[w|| etv := |[w||/|u{|, 
u + ivw, est un vecteur propre de À, c.-à-d. 


Au + ivuwi) = (a +iB)(u1 + ivu:) 


et en séparant les parties réelles et imaginaires on obtient 


Alta ua) = (ua un) (9 “4 


On complète les deux vecteurs u1, w en une base orthonormale (pour obtenir U1) et on voit que 
les deux premières colonnes de UfA U, sont comme demandées dans (2.3). 

On termine la démonstration par induction sur la dimension de la matrice exactement comme 
dans la démonstration du théorème 2.3. m 
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Corollaire 2.6 Si A est une matrice réelle et symétrique (i.e, At = A), il existe une matrice 
orthogonale U telle que 

D AU = U*AU = diag (A1, ..., An). (2.4) 
Les valeurs propres À; de A sont réelles. 


Démonstration. Si À est symétrique, la matrice UtA U de (2.3) est aussi symétrique. Ceci im- 
plique que les À; sont de dimension 1. Par conséquent, toutes les valeurs propres sont réelles et 
UTA U est diagonale. o 


Paradoxe Les démonstrations précédentes nécessitent la connaissance des valeurs propres pour 
trouver la forme normale de Schur. Au cours “Analyse Numérique”, nous apprendrons l’algorithme 
QR qui est un procédé itératif pour calculer la forme normale de Schur (sans utiliser explicitement 
les valeurs propres). Ceci est alors un algorithme (en fait le plus important) pour calculer les 
valeurs propres d’une matrice. 


II.3 Formes quadratiques 


Considérons une fonction quadratique à deux variables 


f (£1, £2) = ax? + 2bxı£ + cx? + di + exo +g (3.1) 


et étudions l’ensemble M = {(£1, £2); f(£1, £2) = 0} qui constitue une courbe dans R°. Elle 
s’appelle conique (comme intersection d’un cône avec un plan). Par exemple, la fonction 


fi(x1, £2) = x? + 2bt1To | r2 5x1 — 4x2 + 9 (3.2) 


donne les coniques de la figure II.2. Comment peut-on déterminer s’il s’agit d’une ellipse, d’une 
hyperbole ou d’une parabole ? 


Figure II.2: Les coniques correspondantes à la fonction (3.2) avec b = 0.5 (gauche), b = 1.5 
(milieu), b = 1 (droite) et avec plusieurs valeurs de g 


Nous écrivons la fonction (3.1) sous forme matricielle 


f(x) = 2 Az + B'x+C (3.3) 


a b d 
s=( 9. 2- (); ces 


et nous essayons de transformer cette fonction par un changement de coordonnées en une fonction 
plus simple. 

Considérons tout de suite une fonction (3.3) dans R” où A est une matrice symétrique de 
dimension n, B € R” et C € R. Pour simplifier une telle fonction, nous procédons en deux pas: 
une rotation et une translation. 


Où £ = (zı, T2) et 
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Rotation Comme A est symétrique, il existe une matrice orthogonale U (i.e. UU = T) avec 
det U = 1 (corollaire 2.6) telle que 


AU = D = de(s A) 
Avec le changement de variables x = Uy, on obtient alors (avec Et = BtU) 
a'Ax + Biz + C = y D y + Ety +C. 


Translation Avec la translation y = z + c (c est un vecteur de R”), la forme quadratique devient 


y'Dy+ Ety +C = 2 Dz+(2Dc+E)z+cDce+Etc+C. 


Si À; # 0, on définit c; = —d; / (2A;) afin d’annuler le terme linéaire en z;. Finalement, si un des A; 
vaut zéro, par exemple À, = 0, mais si dn 0, on peut choisir c, afin d’annuler le terme constant. 


Avec toutes ces simplifications et en notant la variable de nouveau par x = (x1, ..., £n), on 
obtient 
M={xEeR"|z2Dx+B'x+C=0}, 
où D = diag(A1,...,),) est une matrice diagonale, D B = 0, et C = 0 si B 0. On distingue 
alors les cas suivants: 


hyperellipsoide: si À; > 0 pour à = 1,...,n (ou tous les À; négatifs) 


hyperhyperboloïide: s’il y a au moins un À; positif, et au moins un À; négatif 


hyperparaboloïde: si À; > 0 pour i = 1,...,n — 1, À, = 0, et dn # 0 


hypersphère: si À; = 1 pour i = 1,... n 
e hyperplan: si À; = 0 pour i = 1,...,n. 


Cas n = 2 Selon les signes des deux valeurs propres on obtient (avec x, y au lieu de x1, £2) 


2 2 2 
1 10 (ellipse), 


2 
p p = z + 1 = 0 (hyperbole), x° — 2py = 0 (parabole). 


a2 
Cas n = 3 En négligeant les cas dégénérés où M est l’ensemble vide, un point, ou une surface 


cylindrique (c.-à-d. xt D x + B'x + C ne dépend que de deux variables), on a les surfaces suivantes 
(nous écrivons x, y, z au lieu de z1, £2, £3): 


r y? z2 SE 
(A) gtp + E 0 (ellipsoïde) 
x? y? 22 
(B) — += —— +1=0 (hyperboloïde à deux nappes) 
@ PP æ 
E NE oinas 
CO = +5- 1 = 0 (hyperboloïde à une nappe) 
dé P e 
L y 2? : 
(D) arp oF 0 (cône) 
x? y? 
Œ — + —2pz =0 (paraboloïde elliptique) 
a P 
x? y? 
Œ) —-— —2pz =0 (paraboloïde hyperbolique) 
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II.4 Matrices définies positives 


Dans ce paragraphe nous étudions des matrices symétriques pour lesquelles la forme quadratique 
f(x) = xtA x est toujours non-négative. Dans les applications, x est souvent un vecteur de vitesse, 
A une matrice de masse et x! A x l énergie cinétique. 


Définition 4.1 (matrice définie positive) Une matrice symétrique À s'appelle définie positive si 
x'Ax > 0 pour tout x € R”, x #0. (4.1) 
Elle s'appelle semi-définie positive si 
x'Ax > 0 pour tout x € R”. (4.2) 


Remarquons qu’une matrice définie positive nous permet de définir une norme sur R”, 
lella := VrtArz. (4.3) 


Motivé par des applications, cette norme s’appelle souvent norme d'énergie. Les propriétés (N1) 
et (N2) d’une norme sont facile à vérifier. L’ inégalité du triangle (N3) se démontre comme dans la 
preuve du théorème I.1.1 à l’aide de l’inégalité de Cauchy-Schwarz 


at A yl < [fxila - lulla (4.4) 


Cette dernière suit de 0 < (x + uy A(z + uy) = atAx + 2uxtAy + p’ytAy en posant u = 
—x' A y/y'A y (comme on l’a fait pour la norme euclidienne). 


Théorème 4.2 Nous avons les critères suivants (A; sont les valeurs propres de À): 


À est définie positive <=>  À;>0 pour i=1,...,n, 
À est semi-définie positive <=> A20 pour i=1,...,n. 


Démonstration. On utilise le corollaire 2.6 qui garantit l’existence d’une matrice orthogonale telle 
que UAU = D = diag(A,...,),). Pour x € R” arbitraire, définissons y € R” par x = Uy. 
Nous avons alors : 
2 
x'A x = y D y = à. AJY; (4.5) 
j=1 
et on voit que (4.1) est satisfait pour tout x Æ 0 (i.e. l expression (4.5) est positive pour tout y # 0) 
si et seulement si tous les À; sont positifs. 
La démonstration pour le critère d’une matrice semi-définie positive est analogue. m 


La caractérisation des matrices définies positives du théorème précédent nécessite la connais- 
sance de toutes les valeurs propres de la matrice. Il est connu qu’il n’y a pas d’algorithme fini qui 
permet de faire ce calcul pour toutes les matrices. 

Le théorème suivant nous permet de décider si une matrice symétrique A est définie positive 
ou non avec un nombre fini d’ opérations. 


Théorème 4.3 Pour une matrice symétrique A de dimension n nous considérons les sous-matrices 
a g Q11 Q12 Q13 
11 12 
A1 = (au), A2 = ; A3 = | an G2 az 3 tt An =A. 
Q21 Q22 
a31 Q32 Q33 
Alors, 
A est définie positive <=> detA; >0 pour i=1,...,n. 


Calcul matriciel 25 


Démonstration. Nécessité. Le déterminant d’une matrice définie positive À est positif car detA = 
A... An > 0. Pour un vecteur x = (21,...,%,) € R”, notons par P;x = (x1,...,x,,0,...,0)" 
sa projection sur les j premières composantes et par X; = (21,...,x%;)". On a alors 


XjA;X; = (P;x) A CR] > 0 pour tout Xj + 0, 


ce qui implique que À; est définie positive et donc detA; > 0. 

Suffisance. Cette partie de la démonstration se fait par récurrence sur la dimension n de la 
matrice. Pour n = 1, il n’y a rien à démontrer. Supposons alors que A„—ı soit définie positive et 
que detA,, > 0. On peut donc diagonaliser À,,_: à l’aide d’une matrice orthogonale U. Ceci donne 


Ut 0 U 0 D b 
k a w ele n (0 


où D = diag(yu,..., Un-1) avec u; > 0 (les valeurs propres de 4,,_1), b = (b1,...,b4 1) € R”! 
etc € R. En observant que le déterminant de la matrice (4.6) est égal à det A, et en développant 
le déterminant de (4.6) relativement à la dernière ligne (voir le paragraphe IV.3 du polycopié de 
“Algèbre I”), on obtient 


b? b2 
detAn = pit pna ( 2 +6) >0. 
Hı Hn—1 


D'autre part, on a pour x € R” et avec y € R” donné par x = E 1) y que 


n—1 n—1 
D b 
LA, = yt F à y = DD Hjy; + 2Un D» bjyj + cy?. (4.7) 
j=1 j=1 


L’inégalité de Cauchy-Schwarz (1.1.5) appliquée aux vecteurs (b;/,/H;); et (VA,y;); donne 


n—1 2 n—l1 p2 n—1 n—1 
Don] (ZA) )s e Du. 
j=l J= Fi j=1 j=1 


2 
En insérant cette estimation dans (4.7), nous obtenons ztA„ z > (: [> jy} =. ETA > Det, 


par conséquent, À; > 0 pour les valeurs propres de A„. Comme detA,, > 0, ces valeurs propres 
sont nécessairement strictement positives. m 


ILS Norme d’une matrice 
Le but de ce paragraphe est de majorer l’expression Ax où À est une matrice m x n. 
Définition 5.1 (norme d’une matrice) Soit À une matrice m x n. On définit 
lA] = sup{lAx|; [xl < 1} (5.1) 
et on appelle ce nombre la norme de la matrice A ou la norme de l'application linéaire f(x) = Ax. 


Comme la boule unité K := {x € R”; ||æ|| < 1} est un ensemble compact et la fonction 
linéaire f(x) = Ax est partout continue, le théorème [.4.5 implique que ||A| est finie et qu’on 
pourrait remplacer le “sup” par un “max”. 
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Des expressions équivalentes pour ||A|| sont 


Ax 
JAI = sup Aal]; el = 13 = su (à 40}. (5.2 
De cette dernière formule, on voit que ||A|| est le plus petit nombre réel tel que 
Az] < [A] : x] pour tout x € R”. (5:3) 


L’inégalité (5.3) est fondamentale pour tous les calculs avec des applications linéaires. 

Remarquons encore que | A| dépend des normes choisies dans les ensembles de départ et 
d'arrivée. Si l’on choisit la norme ||- ||, (p = 1, 2 ou œo) dans les deux espaces, on dénote la norme 
de A par |A], = sup{ | Ax|, ; [x], < 1}. Considérons par exemple la matrice 


1.4 1.0 
fe Ce M) | 
La figure II.3 montre l’image f(B) de la boule unité B pour les trois normes (nous avons aussi 
dessiné les images de quelques droites verticales et horizontales). En traitillé nous avons ajouté la 
boule unité avec rayon ||A||p. Elle possède le plus petit rayon parmi les boules contenant l’image 


f(B). Pour cette matrice on trouve que |A], = 2.7, | All = 2.29466 et |A] = 2.4 (voir aussi 
le théorème 5.3 plus bas). 


Figure II.3: Norme d’une matrice: 44 (gauche), euclidienne (milieu), maximum (droite) 


Pour justifier la notation “norme d’une matrice” démontrons le résultat suivant. 
Lemme 5.2 L'application A + ||A| (de l’ensemble des matrices M,,,(R) dans R) est une 
norme, c.-à-d. elle satisfait les propriétés (N1), (N2) et (N3). De plus on a 
HI=1 et |AB| < IAI IB| (5.4) 
où ÍI est la matrice identité et A, B sont deux matrices dont le produit AB est bien défini. Pour 


avoir ||T|| = 1 il faut choisir la même norme dans les ensembles de départ et d'arrivée. 


Démonstration. Les propriétés (N1) et (N2) d’une norme sont faciles à vérifier. Démontrons (N3): 
pour A, B € Mm,n(R) nous avons 
IA + Bjr < ||Azx|| + ||Bzl| < (AN + IBIDIlel. 

En divisant cette relation par ||x|| et en prenant le supremum, nous obtenons l’ inégalité du triangle 
A+ BI < |All + [B|]. 

La propriété ||Z|| = 1 est évidente. Pour démontrer l’estimation de || AB ||, nous appliquons 
deux fois l’inégalité fondamentale (5.3), 

IAB) < All Bal] < IAIL BI æl]: 


Ensuite, nous divisons cette relation par ||x || et nous prenons le supremum sur x + 0. o 
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Pour la norme 44, la norme euclidienne et la norme maximum, il existe une formule explicite 
pour |A|], = sup{ [Az], ; [xl < 1}. 


Théorème 5.3 Pour une matrice A de type m x n, on a les formules 


LA = max (Dial), Ale = max (X layl). 
i=1 j=1 
lAl = plus grande valeur propre de AA. 


Démonstration. Pour la norme |x||1, on a 


m m 
Axl = 2 | > aux < >> CARE Do ail) kil < zan al) - le. 
On en déduit que [A1 < max;(9';la;;|). Pour montrer légalité, on choisit un jọ avec 
mao laz) = ST = (0,...,0,1,0,...,0)7, où 1 est à la position jo. 
Ce choix de x donne l’égalité dans l’estimation ci-dessus, ce qui démontre que || A||; ne peut pas 
être plus petite que max;(9;;la;;|). La formule pour la norme |x|. se démontre de la même 
manière. 

La matrice A*A étant symétrique et semi-définie positive (x! AtAx = || Ax|5 > 0), il existe 
une matrice orthogonale U (UtU = I) telle que UAA U = diag(A,..., An), où À; > 0 sont les 
valeurs propres de A*A. On obtient avec la transformation x = Uy et en utilisant ||x||2 = |[y|}2 que 


Ar|} = at AŸAx = y'U' A'A Uy = Du < Amex lull? = Amex [le 


i=1 
Ceci implique que |A]: < Vmax. Pour montrer légalité, on pose x égal au vecteur propre de 
A*A qui correspond à la valeur propre Amax- m| 


II.6 Applications bilinéaires et multilinéaires 
En vue d’une étude des dérivées supérieures d’une fonction à plusieurs variables (chapitre III), 
nous préparons quelques notations concernant des applications bilinéaires et multilinéaires. 


Définition 6.1 (application bilinéaire) Une application B : R” xR? — R™ s'appelle bilinéaire 
si elle est linéaire dans chacun des arguments, c.-à-d. si les applications suivantes sont linéaires: 


x= B(x,y) pour tout y E€ R? et y = B(xz,y) pour tout x € R”. 
Si l’on écrit les vecteurs x et y dans la base canonique, la bilinéarité implique que 
= B(S he Duc) = D» DRETTTIC ex) 
j=1 k=1 j=1 k=1 
Chaque application bilinéaire peut donc être écrite sous la forme 


(ES jerm) . (6.1) 


j=1 k=1 
Pour m = 1, elle devient simplement 
B(x,y) = z*By (6.2) 


avec une matrice B = (b,;),, du type n x p. Pour le cas général, la ième composante de B(x, y) 
est de la forme suivante: B;(x, y) = x'B;y avec (biy )j,x- 
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Norme d’une application bilinéaire Comme pour des applications linéaires, on définit 


B(x,y 
IBI= sw [Bel su El (63) 
læll<4, lol <1 #40, v40 llel- lll 
et on obtient que || B|| est le plus petit nombre satisfaisant 
By) < BIke ly]  pourtout z ER”, y €R”. (6.4) 


L'expression ||B|| de (6.3) dépend évidemment des normes choisies dans les trois espaces R”, R? 
et R”. Si l’on prend la même norme || : ||, (avec p = 1, 2 ou ) dans ces trois espaces, on dénote 
la norme de l’application bilinéaire par ||B ||p. 


Théorème 6.2 On a les majorations 


n p 


DD Bl < max DM 


i=1 j=1 k=1 das 


m 
Bla < > max [bal lB ll2 < 
i=1 ” 


Démonstration. Donnons la démonstration pour la norme £44. La ième composante de B(x, y) peut 
être majorée comme suit: 


Be < [E E en] < mi ( E e) (E w). 


j=1 k=1 j=1 


On obtient donc 
BC, y)lh = dB: y)l < > max Bal Ill llulla 
i=1 i=1 ” 


et on en déduit la majoration pour ||B||1. 
La démonstration pour la norme maximum est similaire et celle pour la norme euclidienne 
utilise plusieurs fois l’inégalité de Cauchy-Schwarz. m 


Applications multilinéaires Une application M : R”! x- - -x R”* — R™ s'appelle multilinéaire 
si elle est linéaire dans chacun des arguments. Les notations et résultats pour des applications 
bilinéaires se généralisent sans difficulté. 

Une applications multilinéaire est toujours sous la forme 


1 k zily [k] 
Me iip kl) = (5. Se Mji, ojk Ti ae a) =] 


jı=1 jk=1 
et sa norme est définie par 
Asa x] 


= HI xl = 
A7 | sup AZ (x MAT A )1] = sup . x A] | 4 


[PAIE en PL ES 110,020 e|] 


(6.5) 


On a des majorations comme dans le théorème 6.2. Par exemple, 


[Ml z es To S Im; Mi. jr 


jı=1 jk=1 
Une des raisons pour laquelle on travaille avec des applications multilinéaires est justement d’ éviter 
des expressions avec beaucoup de sommes et d’indices. 


II.7 Exercices 


Chapter III 


Calcul différentiel (plusieurs variables) 


Le but de ce chapitre est d’introduire la notion de différentiabilité pour des fonctions à plusieurs 
variables. Comme la division par le vecteur x — x, n’a pas de sens, il n’y a pas de manière évidente 
d'étendre la définition f'(xo) = lim, ent, 


Nous suivrons de près la E des paragraphes IV.3 et IV.4 du livre “L'analyse au fil de 
l’histoire” de Hairer & Wanner (Springer-Verlag 2000). 


II.1 Dérivées partielles 


Pour une fonction f : U — R, U € R”, nous fixons toutes les variables sauf une et nous 
considérons f comme une fonction de cette variable. Nous pouvons alors appliquer la définition 
bien connue pour une fonction à une variable. Considérons plus en détail le cas d’une fonction à 
deux variables. 


Une fonction à deux variables Considérons par exemple une fonction y = f(x1,x2) qui est 
définie dans un voisinage de (x10, £29). Alors, les limites 


lim f(tio + h, £20) — f (x10, £20) 2 o pts 

h—0 h oxı (1.1) 
lim fo, £20 + h) — f (£10, £20) Le 5 
TT 


s’appellent les dérivées partielles de f par rapport à xı et x2, respectivement. Parmi d’autres 
notations on utilise Ía (£10, z2), D; f (£10, £20), o; f (£10, T20). 

Géométriquement, les dérivées partielles peuvent être interprétées comme suit : la fonction 
y = f(x1, £2) définit une surface dans R? (avec des coordonnées z1, z2, et y), dont l'intersection 
avec le plan x2 = z2 est une courbe zı + f(z£1, £20). La dérivée partielle 0 f /Əxı est la pente de 
cette courbe, et 

of 
y = f (T10, £20) + De, (10° T20)(T1 — T10) (1.2) 

est l’équation de la tangente à cette courbe en (x10, £20). De la même manière, la tangente à la 
courbe T2 > f (£10, T2) a pour équation y = f(x, T20) + Of /0x2 (£10, T20) (T2 E T20), et le plan 
déterminé par ces deux tangentes est donné par 


Ô 
y = f(t10, £20) + de 


Ô 
(£10, T20)(&1 — £10) + 21 (£10, T20)(T2 — £20). (1.3) 
T2 
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Une fonction f(x1, £2) sera dite différentiable en (x10, £20) si le plan (1.3) est une “bonne” approx- 
imation de f(x1,%2) dans un voisinage de (£10, 720), et pas seulement le long des lignes xı = x10 
et T2 = T20. 


Exemple 1.1 La surface définie par y = er est représentée sur la figure II.1. Nous voyons 
également les courbes x1 + f(£1, £20) et z2 + f(z10, %2) passant par le point (x10, £20) = 
(0.3, 0.1). En évaluant les dérivées partielles 

Of se Of 


— (z1, £2) = —-2re l — (z1, £2) = —-272e 


oxı xə 


3ra 
PERLA 


en ce point, nous obtenons les tangentes en ces courbes au point (£10, £20) à l’aide de la formule 
(1.2) ainsi que le plan tangent à l’aide de (1.3). 


Ho 
Re 
22 TAANE PANOA 


L TALIO e 
2 LAILL 


Figure IIT.1: Plan tangent à la surface y = ei" 


Deux fonctions à deux variables Dans le cas d’une fonction f : R? — R?, c.-à-d. 


Vi — fi(zı, £2), V2 = Jai, £2), (1.4) 


nous écrivons (1.3) pour chacune des deux fonctions : 


Ô Ô 
yı = f1(ti0, £20) + Ch t20)(T1 — £10) + oh T2) (T2 — T20), 
oxı xə 
(1.5) 
Y2 = f2(z10, T20) T Ph t20)(T1 = T10) fe Be, t20) (T2 F T20). 
| xı | x2 
Il est commode d’écrire cette formule en notation vectorielle : 
y = f (£o) + f'(£o)(£ — x0), (1.6) 
où f'(xo) est une matrice, appelée matrice jacobienne : 
oh (y 9h (% 
f'(&o) = ( ons i Zal ) (LT) 
oxı (z0) 0x2 (xo) 


Cette notation nous permettra de transposer la plupart des formules d’une variable au cas de 
plusieurs variables. 


Exemple 1.2 Considérons la fonction f : R? — R°? définie par 


“ie fifti, £2) \ zı — L.1sin(x + z2 +1) +1.1sinl (1.8) 
 OUfo(a, co) ) (z2 + 0.121 — 0.8 cos(æ1 — z2 + 1) + 0.8cos1 j ` i 
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5H 


T2 


PTT 
RE 


Figure II.2: Graphique de l’application (1.8) 


Cette fonction envoie l’origine (x1, x2) = (0,0) sur le point (y1, y2) = (0, 0), les droites sur des 
courbes, et les petits carrés sur des ensembles qui ressemblent à des parallélogrammes (voir la 
figure IIL2, dessin en haut au milieu). La matrice jacobienne pour (1.8) est 


ro 1 — 1.1 cos(xzı +x2 +1) —1.1 cos(x1 + z2 + 1) (1.9) 
(0.1 +0.8sin(zı — z2 +1) 1-—0.8sin(zı — vo +1) / ? i 
et l'équation (1.5) devient pour xo = (0,0), yo = f (zo) : 
Yyı—=yo\ — 1 — 1.1 cos 1 —1.l cos 1 Zi — Lio (1.10) 
Y2 — Yao J  \0.1+0.8sin1 1-—0.8sin1 T2 — T20 i 


Cette application linéaire est illustrée dans le dessin en haut à droite de la figure II.2. Les trois 
dessins de la deuxième ligne de la figure III.2 sont des agrandissements de cette application non 
linéaire proche de l’origine. Nous voyons qu’elle est, dans un petit voisinage de x, bien approchée 
par l’application linéaire définie par la matrice jacobienne. 


IIL2 Différentiabilité 


Considérons une fonction 
J:U—R”, UCR” (2.1) 


et supposons que x, € U soit un point intérieur de U (c.-à-d. U est un voisinage de xo). 
Définition 2.1 (Stolz 1887, Fréchet 1906) La fonction (2.1) est différentiable en xo s’il existe une 


application linéaire f'(xo) : R” — R” et une fonction r : U — R”, continue en xo et satisfaisant 
r(xo) = 0, telles que 


fe) = (co) + J'(@0)(@ — 20) + r(æ)||æ — zoll. 2.2) 
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Remarque. Si une fonction est différentiable en xo, elle est continue en ce point. De plus, toutes 
ses dérivées partielles existent en zo. C’est une conséquence du fait que, pour x — xo = he; (où 


ej = (0,...,0,1,0,...,0)* avec la jème composante égale à 1), l’ équation (2.2) devient 
+ he;) — h 
La tu) = f'(to)e; + r(xo + he; (2.3) 


Comme r(x) est continue en zo, la limite de cette expression pour h — 0 existe et est égale à 


of S(xo) --. SE (x) 
gz (0) = f'(xo)e;, donc f'(xo) = : : (2.4) 
J Ofm 0 fm 
Jar (To) = ges (to) 
(ici, f(x) = (f(x)... fn(æ))). Par conséquent, l'application linéaire de la définition 2.1 est 


unique et donnée par la matrice jacobienne (2.4). 


Lemme 2.2 (caractérisation de Carathéodory) La fonction f(x) de (2.1) est différentiable en xo 
si et seulement s’il existe une fonction y(x) à valeurs matricielles, dépendant de xo et continue en 
to, telle que 


F&) = Fo) + p(x)(x — xo). (2.5) 


La dérivée de f(x) en xo est donnée par f'(xo) = (xo). 


Démonstration. Pour une fonction donnée (x), nous posons 


f’(&o) := (0), r(x) := (p(z) — (zo), 


et nous voyons que (2.2) est vérifiée. Comme (x — x0)/|x — xo|| est borné par 1, il suit de la 
continuité de y(x) en x, que r(x) — 0 pour x — x. 
D'autre part, supposons que (2.2) soit vrai. Nous définissons (xo) := f'(xo), et pour x Æ zo, 


(x — xo)' 


læ — zoll 


p(z) := f'(z0) + r(x) (2.6) 
(observons que le produit du vecteur colonne r(x) avec le vecteur ligne (x — zo )* est une matrice), 
et nous obtenons (x)(x — zo) = f'(£o)(£ — zo) + r(x)||x — xo|. La fonction y(x) est continue 
en xo Car, par la définition de la norme matricielle et en utilisant l’ inégalité de Cauchy-Schwarz, 
læ) = P'(xo)|l < lir@æ)l et |r(x)|| — 0 pour x — xo. o 


Le résultat suivant donne une condition suffisante pour la différentiabilité qui peut être vérifiée 
en considérant seulement des dérivées partielles. 


Théorème 2.3 Considérons une fonction f : U — R et un zo € U (point intérieur). Si toutes 
les dérivées partielles O0 f /Ox; existent dans un voisinage de xo et sont continues en xo, alors f est 
différentiable en xo. 


Démonstration. Nous expliciterons la démonstration pour le cas n = 2. La généralisation à un n 
arbitraire est immédiate. L'idée est d'écrire f(x) — f(x0) comme 


f(x: £2) = f (£10, £20) = (f(z, £2) = f(z10, x2)) T (f (to: £2) E f(z10, £20)) 
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et d’appliquer le théorème de Lagrange à chacune des différences. Ceci donne 


f(a1, £2) — f (£10, £20) = Lie, £2)(£z1 — T10) + SL Cao, £)(2z — T20) 


avec 6. entre £10 et z1, et E2 entre £29 et z2. En posant 


pr, £2) = (Lesa), TT) 


nous avons établi (2.5). La continuité de y(x) en x, est une conséquence des hypothèses. m 


Par la définition 2.1, une fonction f(x) = (fi(x),..., fn(x))" est différentiable en zo si 
et seulement si f;(x) est différentiable en x, pour tout à = 1,...,m. Une conséquence du 


théorème 2.3 est que les fonctions dont les composantes sont des polynômes en z1,...,2%,, des 


fonctions rationnelles ou des fonctions élémentaires sont différentiables aux points où elles sont 
bien définies. 


Exemple 2.4 (Une fonction discontinue dont les dérivées partielles existent partout) Considé- 
rons la fonction f : R? — R donnée par 


T1T2 D 2 
si zf + xs > 0 
f(z1, £2) = i r + 22 HO (2.7) 


0 Si Xi = Lo = 0 


(voir la figure I.9). Ses dérivées partielles sont nulles à l’origine car f(x1,0) = 0 pour tout x. et 
f(0,x2) = 0 pour tout x2. En dehors de l’origine, l’existence des dérivées partielles est évidente. 
Néanmoins, la fonction (2.7) n’est pas continue à l’origine (voir l’exemple 1.4.3). 


La dérivée en chaîne Considérons deux fonctions 
ne i mI P 
R — R — R 


t: —> y ==> z 


et étudions la différentiabilité de la fonction composée (g o f)(x) = g(f(x)). Nous utilisons la 
caractérisation de Carathéodory (lemme 2.2). En supposant que f soit différentiable en x, et que 
g soit différentiable en yo = f(xo), nous avons 


f(x) = f (zo) + p(æx)(x — zo),  g(y) = glyo) + Yy) — vo). 


En posant y = f(x), yo = f (£o) et en introduisant la première équation dans la deuxième, nous 
obtenons 

gx) = g(f (z0)) + Y(S(z))p(z)(2 — x0). (2.8) 
Puisque le produit 4 (f(x))(x) est continu en zo, la dérivée de g o f est égale à ce produit évalué 
en zo, i.e. 


(g o f) (z0) = g'(yo) * f'(£0). (2.9) 


En coordonnées, le produit (2.9) s’écrit 


= — . 2.10 
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Exemple 2.5 Supposons que le mouvement d’un corps soit décrit en coordonnées polaires par 
f(E) = (r(t), p(t)}Ý. Si nous voulons connaître la vitesse en coordonnées cartésiennes 


AE [receoso 
r ean 
il nous faut dériver x et y par rapport à t. Comme la matrice jacobienne de (2.11) est donnée par 
1 _ [cosy -rsin 
gin p= r cos Y ) | 2 


il suit de (2.9) que 
t = COS D: F — rsin Y - g, y =siny: t +rceoso: o 


(la dérivée par rapport au temps t est désignée par un point). Ceci nous permet, par exemple, de 
calculer l’ énergie cinétique 

m m 

TD = D + 7) = LA 


.2 2.2 
3 Ttr gs). 


II.3 Dérivées d’ordre supérieur 
Considérons tout d’abord une fonction f(x, y) de deux variables. Ses dérivées partielles, par ex- 


emple 0 f/Ox, sont aussi des fonctions de deux variables et nous pouvons calculer itérativement 
leurs dérivées partielles comme dans le diagramme suivant : 


TE of d Pf 
A Ox Ox? 
2 2 

dy oy 

of à, fr f m 

mé — sé 

oy Ox0y OyOx 

2 2 

él él 

r à Of ? Of o 

8y? OxOy?  ðy2ðx 


La question est de savoir si ces dérivées dépendent de l’ordre de différentiation. 


Exemple 3.1 Considérons la fonction f(x, y) = 4/x? + 5y? et calculons ses dérivées partielles 
(pour x? + 5y? > 0): 


che TE 3f (z e a 
ðr’ PIRE 5y? ðyðr ‘ ? (x? + 5y?) 
Of 5y of —5ry 

ay OO T ra A Ge ser 


Nous obtenons que 

®f A ®f 
pour cette fonction. Un calcul avec d’autres fonctions (par exemple avec des polynômes) laisse 
deviner que (3.1) est toujours vrai. Cependant, (3.1) n’est pas vrai sans hypothèse supplémentaire, 
comme on peut le voir à l’aide du contre-exemple suivant. 


(3.1) 
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Exemple 3.2 (Contre-exemple) Pour trouver une fonction qui ne vérifie pas (3.1), nous con- 
sidérons une fonction 
Jay) =£ yg(z,y), (3.2) 


où g(x, y) est bornée (mais pas nécessairement continue) dans un voisinage de l’origine. Pour cette 


fonction, on a 
Of f(x, y) — f(0,y) 


37 (0: y) = lim = = lim y g(x, y). 
La dérivée de cette expression par rapport à y est 
®f ; : 
Dudx (0, 0) = tim ( lim g(x, y)), (3.3) 
à condition que cette limite existe. De même, on a 
®f | 
Oxr0y QE lim ( late y). GD 


Il suffit de choisir une fonction g(x, y) pour laquelle les limites dans (3.3) et (3.4) sont différentes. 
C’est le cas de 
x? — y? 
x? + y? 
pour laquelle lim, _,0 g(x, y) = —1 pour tout y Æ 0 et limo g(x, y) = +1 pour tout x Æ 0. Par 
conséquent, les dérivées partielles 
of of 

0y0x Ox0y 

sont différentes pour la fonction définie par (3.2) et (3.5). 


g(x,y) = si æ+y > 0, (3.5) 


(0,0)=-1 œt (0,0) = 1 


SD n 2 
Théorème 3.3 Considérons une fonction f : R? — R dont les dérivées partielles Ë ; of 3 o f 
P ox? y? yox 


existent dans un voisinage de (£0, Yo), avec 2L continue en (£o, yo). Alors, 2 existe en (£o, Yo) 
et 
of ® f 
——— (Lo, Yo) = =—=— (T0, Yo). foi Ju 
Démonstration. L'idée est de considérer un petit rectangle de 
côtés h et k. On désigne les valeurs de f aux sommets de ce k 
rectangle par foo, foi, fio et f11. Les dérivées partielles sont foo L fio 
approximativement données par A h F 
To To + h 
a yo) x PAO aie yot k) ax a 
Ər 0; 90 h ; Ôx 0; 90 h G 
On en déduit que 
2 of k) — 9 = 
CI a SE (Lo; Yo + k) — 55 (To, Yo) 7 Ju — foi — fio + foo (3.6) 
ðyðxr k h-k i | 
et de même j je 
PF Go thyo) — Got) | fu — fo — fu + fo ED 


ðxrðy h k-h 

Les membres de droite dans (3.6) et (3.7) sont identiques et l’ affirmation du théorème est plausible. 
Pour une démonstration rigoureuse de ce théorème nous vous référons à la page 318 du livre 
“Analyse au fil de l’histoire”. m 
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L'application répétée de ce théorème permet d’échanger des dérivées d’ordre supérieur. Par 
exemple, 


280000, 00000, 00000, 
Ox Oy Ox Ox ðy Ox Ox Oy Ox Oy* Or Or Or Əy Əy 
— nm ae at 
‘SNZ 9 NSZ 9 


Cette manière de procéder est aussi valable pour des fonctions de plus de deux variables. En effet, 
nous échangeons toujours deux dérivées partielles à la fois, en maintenant constantes les autres 
variables. 


II.4 Série de Taylor 


Rappelons que la série de Taylor d’une fonction g(t) à une variable est donnée par 


3 


t 
É "oE neni (4.1) 


g(t) = g(0) + g'(0)t + g”(0) = 


2! 


Il s’agit de généraliser cette formule à des fonctions de plusieurs variables. Pour éviter une notation 
trop lourde, considérons d’abord le cas de deux variables. 


Deux variables L’idée est de ramener le problème à une yo +k 
variable en reliant les points (£o, Yo) et (£o + h, yo + k) par 
une droite. On considère alors la fonction 
Yo 
g(t) := f(xo + th, yo + tk) To Toth 


et on applique la formule (4.1) avec t = 1. Il reste à calculer les dérivées de g(t). Si f(x,y) est 
suffisamment différentiable, la dérivée en chaîne nous donne 


of 


ð 
g'(t) = 3x (0 + th, yo + tk) h + SL (re + th, yo + tk) k (4.2) 


et une différentiation de plus donne 


n o? f o? f 3f 3f 
ji ae CRE ES Chk + SE dy Que OL (4.3) 


où l’argument des dérivées partielles de f, que nous avons omis, est (£o + th, yo + tk). Les 
deux termes centraux dans (4.3) sont égaux par le théorème 3.3 (en différentiant encore, on ferait 
apparaître des coefficients binomiaux). En insérant ces dérivées de g(t) dans (4.1), il vient 


f(to+h,yo+k) = f(zo, vo) + RP + So vo) 


Ox 
1/8 f ci Of 2 
Sa (So vo) Te EN (z0, yo)hk + = ET =z (20; Yo)k ) (AA) 
1 f of Ef ®f 
T g ( ga (0: yo)h° aa Su 20y (£o, yoh’ k + S502 ðy z (zo, yohk? + ae vo)K) se 
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Exemple 4.1 Considérons la fonction f(x,y) = a (voir aussi l’exemple 1.1), dont les 


dérivées partielles sont données par 


o 2,2 Ô ne 
SL (a, y) J —2xe © E à Se = —2ye * r p 

7 =r? —y? o = 2 
Ey) = (4x? co 2)e y ; (Eu) er (4y? S 2)e y | 
o f f 


z? n spit 
ST (x,y) Oydx (x, y) = Axye : 


En négligeant les termes d’ordres trois et supérieurs dans la formule (4.4) et en posant xo = 0.3, 
Yo = 0.1, nous obtenons l’ approximation quadratique 


f(0.3 + h,0.1 + k) & e 1 (1 — 0.6h — 0.2k 


1.64h? + 0.12hk — 1.96k°) 


qui représente un paraboloïde. La figure II.3 compare cette approximation avec la fonction f(x, y) 
et avec le plan tangent. 


ES 


& XNR NS Na 
A Laaa 
NN 
AA 


Figure II.3: Approximation de Taylor d’ordre un, comparée à l’ordre deux pour f(x, y) = e7® 7” 


Série de Taylor pour n variables Nous généralisons maintenant ces formules aux fonctions 


f: R” — R”, 
où f(x) = (filz), .-., fn(x)) est composée de m fonctions réelles de x € R”. Nous fixons 
zo € R”, h € R” et nous appliquons la formule (4.1) à la fonction g(t) := f;(xo + th). Ceci 
donne of nf 
RÉAL RES —+ Ôz; (zo ta D Loon + Ox;0xk Fou 
+ np A (4.5) 
=i (zo) h;hxhe EE 
3! >> = Eoi Ox;0rrOt,e t 


On peut aussi aller plus loin et écrire (formellement, sans considérer la convergence) 


— OT fil ) 
fi(to) D >>. DE g Pi 


ja 1 j2=1 Ja 


filo + À) = 


Ces formules, assez encombrantes, nécessitent une notation plus compacte. 

Le terme linéaire dans (4.5) n’est autre que le ième élément du produit f’(x5)h (de la matrice 
jacobienne avec le vecteur h). Pour simplifier le terme quadratique, nous considérons l’application 
bilinéaire f(x) : R” x R” — R” appliquée à un couple de vecteurs u et v, dont la ième 
composante est définie par 


(4.6) 
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Le terme quadratique dans (4.5) est donc le ième élément du vecteur f”(xo)(h, h). On peut con- 
tinuer de cette manière à interpréter les dérivées supérieures comme applications multilinéaires. 
Par exemple, f(x) : R” x R” x R” — R” est définie par 


m m Ô , 
(P u, v, w DE SSP zay L) UjVkWe. (4.7) 


j=1 k=1 ł=1 


Avec cette notation, la formule (4.5) devient 


(co +h) = f (£0) + f'(zo)h + z f"(æo)(h,h) + à f(æo)(RRA)+.... (48) 


Formule de Taylor avec reste Même si toutes les dérivées de g(t) en t = 0 existent, la conver- 
gence de la série (4.1) n’est pas garantie. Il est alors souvent utile de considérer une série tronquée 
et d'estimer le reste. Rappelons, par cé que 


t t-s) 


ns avec R=! zi g” (s)ds. (4.9) 
0 . 


g(t) = g(0) + g'(0) t+ g" (0) & J] 


Pour une fonction f : R” — R”™ cela devient 


1 l 1 "(1 -t)}? 1 
f@o+h) = f(zo)+ f (zo)h+ 5r f (20)(h,h) t Rs, Rs = | — f (o+th)(h,h,h) dt. 
$ 0 $ 


(4.10) 
Remarque. Pour une fonction vectorielle g(t) = (g1 (t), - - - , 9m(t))', nous écrivons 


f dt := CET dt,. a mt) dt) | (4.11) 


Par la suite, nous utiliserons l’estimation 


| f s dt] < T lg) || dt, (4.12) 


que l’on obtient en appliquant l’inégalité du triangle aux sommes de Riemann : | X; g(é;)0;|| < 


D lla (S) No. 


Lemme 4.2 (estimation du reste) Soit f : R” — R” trois fois continûment différentiable (c.-à- 
d. toutes les troisièmes dérivées partielles existent et sont continues). Le reste R dans l’équation 
(4.10) vérifie alors 


h 3 
[rol < EE sup "6 + th). 


Démonstration. Les estimations (4.12) et | f” (x)(u, v, w)|| < I” (£) ull- llv] |w]| pour une 
application multilinéaire donnent 


< (1—t) m h\(h.h.h < - -t 111] h h 3 
rols | EG ottia | EE sup 1 + 4 A 


te[0,1] 
ce qui démontre l’affirmation. m 


La norme || f” (xo +th)|| de l’application multilinéaire f” (x) peut être majorée par le formules 
du paragraphe II.6. 
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IILS Théorème des accroissements finis 


La terminologie des ;jaccroissements finis¿¿ s'explique par des raisons his- 


toriques: la notion d’accroissements ;;finis,,;, s'oppose à celle d’accroissements 


jiinfinitésimaux,,, ... (H. Cartan 1967) 
Pour une fonction f : [a,b] — R, le théorème des ac- < 
croissements finis (ou théorème de Lagrange) affirme qu’il f(b) 


existe un £ € (a, b) tel que 


fO- Fa) = FEL- a), D 
si f est continue sur [a, b] et différentiable sur (a, b). Le but  J(a) 


est de généraliser cette formule à plusieurs variables. a b 


Un contre-exemple Pour une fonction f : [a, b] — R”, l'affirmation sous cette forme n’est plus 
vraie. Un contre-exemple est la fonction f(x) = (fi(x), fa(x)) où fı(x) = cosx, fa(x) = sinz, 
et ja, b] = [0, 27]. On a que f(a) = f(b), mais il n’existe pas de £ dans (a, b) avec f'(£) = 0. Par 
contre, on voit que l'inégalité || f(b) — f(a)|| < | f’(£)1| - lb — a] reste vraie dans cet exemple. 
Le cas m = 1 Considérons une fonction f : R” — R et soient a € R” etb € R” deux 
points donnés. L'idée est de relier ces points par une droite x = a + t(b — a) (voir le début du 
paragraphe II.4) et de poser 

glt) := f(a + t(b— a)). 
Si f(x) est différentiable en chaque point du segment {a + t(b — a) ; t € (0, 1)}, la fonction g(t) 
est aussi différentiable et il suit de (2.9) que 


g'(t) = f(a+t(b—a))(b— a). 


Comme g(0) = f(a) et g(1) = f(b), le théorème de Lagrange appliqué à la fonction g(t) donne 
) = g'(T)(1 — 0) et donc aussi 


f(b) — F(a) = f(E)@ — a), (5:1) 
où £ est un point du segment reliant a et b. L’ équation (5.1) ressemble à la formule du début de ce 
paragraphe, mais ici f’(£)(b — a) est le produit scalaire de deux vecteurs. 


Le cas général Soit maintenant f : R” — R™. On peut appliquer (5.1) à chaque composante de 
f(x) pour obtenir 
ð ô 
fib) — fila) R ee (En) bi — a 
Ô mM o mM — 
où tous les & € R” sont sur le segment reliant a et b. L’inconvénient de cette formule est que 
l argument é; est différent dans chaque ligne. 


Théorème 5.1 (théorème des accroissements finis) Soit f : U — R”, U C R” continue et 
différentiable en chaque point du segment “ouvert” (a,b) := {a + t(b— a); 0< t < 1} (on 
suppose que ces points sont des points intérieurs de U). Alors, ona 


FC) — Fall < sup [IFE lo — all, (5.3) 
Ec (a,b) 


où || F'(E)|| est la norme matricielle de la matrice jacobienne. 
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Démonstration. L'idée est de considérer la fonction 
g(t) := X ci fi(a+t(b— a)) = c'f(a+t(b— a)), (5.4) 
i=1 


où les coefficients c1, . . . , Cm Sont pour le moment arbitraires. La dérivée de g(t) est 


g(t) = ve (a +t(b— a))(b; — aj) = c'f'(a +t(b — a))(b — a). 


i=1 j=1 


Une application du théorème de Lagrange donne 


C(F() — Aa = g(1) — g(0) = g'(r) = E= a). (5.5) 


où £ = a + T(b — a) est sur le segment (a, b). Le choix astucieux c = f(b) — f(a) rend maximal 
l expression de gauche dans (5.5). En appliquant l’ inégalité de Cauchy-Schwarz à l’expression de 
droite de l’ équation (5.5), nous obtenons avec (IL.5.3) : 


IF) — FË < EO) -= FEON e — al. 


En divisant par || f (b)— f (a) ||, ceci donne (5.3) (observons que pour || f(b)— f (a)|| = 0 l affirmation 
(5.3) est évidente). m 


IIL6 Deux théorèmes importants de l’analyse 


Le premier étudie l’ existence et l’unicité de systèmes d’ équations non linéaires. Le deuxième traite 
la résolution de fonctions implicites. 


Théorème d’inversion locale. Rappelons que, pour une fonction f : R — R (continûment 
différentiable), la condition f'(a) # 0 implique que la fonction est monotone et donc bijective dans 
un voisinage de a. On cherche à généraliser ce résultat. 

Pour une fonction f : R” — R” (continûment différentiable, c.-à-d. f(x) est partout différentiable 
et sa dérivée f'(x) est une fonction continue de x), considérons l’équation f(x) = y: 


Fitio de) = yı 
falta, 223- +- ,En) = V2 (6.1) 
A ne = Un: 


Elle représente un système de n équations à n inconnues. On aimerait savoir si, pour un y € V C 
R” donné, ce système possède une solution x. La solution, si elle existe, dépend-elle continâment 
(de manière différentiable) de y? On veut donc savoir si la fonction f possède (localement) un 
inverse. 


Définition 6.1 Une fonction f : R” — R” est un difféomorphisme local près de a, s’il existe un 
voisinage Ü de a et un voisinage V de b = f(a) tels que f : U — V soit bijective avec f|y et 
f7|v continâment différentiables. 
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Le théorème suivant donne un critère facile à vérifier qui implique qu’une fonction est un 
difféomorphisme près d’un point. Le résultat est donné sans démonstration. 


Théorème 6.2 (théorème d’inversion locale) Soit f : R” — R” continûment différentiable. 
Alors f est un difféomorphisme local près de a € R” si et seulement si la matrice Jacobienne 


f'(a) = (22 (a)). est inversible. 


O5 ij=1 
Exemple 6.3 Considérons la fonction f : R? — R? définie par 
yı = T1 + 0.22, ya = 0.2 (xı + 0.5) x$ — 0.3 (£1 — 1) £2 — 0.1 £]. (6.2) 


Cette fonction est suffisamment compliquée pour qu’une résolution de l’équation f(x) = y par 
rapport à x = (£1, 22)" soit impossible analytiquement. La fonction est illustrée dans la figure IIL.4, 
où on voit une partie d’un grillage dans le plan (x1, z2) ainsi que son image dans le plan (y1, y). 


T24 Y24 


Figure II.4: Illustration du théorème d’inversion locale 


Pour le point a = (1.2, 1.3), nous avons dessiné son image b = f(a). Comme la matrice 
Jacobienne 


i l 0.6 x2 
f(z) = 4 2 3 
0.2 x5 — 0.3 x2 — 0.3 x] 0.8 (zı + 0.5) z3 — 0.3 (zı — 1) 


est inversible en x = a, le théorème d’inversion locale nous permet de conclure que, pour y 
suffisamment proche de b, le système f(x) = y possède une solution unique proche de a. Ce 
résultat d’existence et d’unicité d’une solution nous encourage à utiliser des méthodes numériques. 

Les courbes traitillées dans le plan (x1, x2) de la figure II.4 indiquent les points où f'(x) n’est 
pas inversible, c.-à-d. où det f'(x) = 0. On ne peut donc pas appliquer le théorème d’inversion 
locale en ces points. En effet, pour le point b qui est l’image du point à, il n’existe pas de voisinage 
V tel que, pour tout y € V, le système f(x) = y possède une solution unique. Le dessin nous 
montre qu’il y a des points y proche de b, pour lesquels f(x) = y ne possède pas de solution dans 
le carré considéré, et d’autres, pour lesquels il y a deux solutions proche de à. 


Théorème des fonctions implicites. Pour une fonction g : R* x R™ — R”, considérons 
l’équation g(x,y) = 0, c.-à-d. 


golT1,.. -Ek Yl; ---;Ym) = 0 (6.3) 


42 Calcul différentiel (plusieurs variables) 


Nous allons étudier si, pour un x € R* donné, cette équation possède une solution y € R”, et si 
cette solution est localement unique. 

Afin de mieux préciser le problème posé, considérons un exemple simple. 
Pour la fonction g(x,y) = £? + y? — 1, l’ensemble des points satisfaisant 
g(x,y) = 0 est un cercle. Fixons maintenant un point (a,b) sur ce cercle. 


Nous voyons sur le dessin d’à côté qu’il existe des voisinages U et V de a 

respectivement de b tels que pour x € U il existe un unique y € V avec 

g(x,y) = 0. Cette affirmation est vraie tant que b 0, mais elle est fausse si 
0g 


b = 0. Nous constatons que la condition b = 0 est équivalente à (a, b) = 0. 


Nous allons généraliser ce résultat à des fonctions g(x, y) plus compliquées et à la situation où 
x et y sont des vecteurs comme dans (6.3). 


Théorème 6.4 (théorème des fonctions implicites) Soit g : R° x R® — R” continûment diffé- 
rentiable et supposons qu'au point (a, b) € R° x R” 


g(a,b) = 0 et (a b) est inversible. 


Il existe alors un voisinage U de a, un voisinage V de b et une application y : U — V (continûment 
différentiable) tels que pour (x,y) E€ U x V ona 


g(x, y) = 0 <> y = y(x). (6.4) 


Remarquons que, pour la fonction g de (6.3), la dérivée partielle 2 représente la matrice carrée 


ð ð 

(2,9) = 

ou Dom (x Vus dam (x ) 
on OY Den EU 


Pour pouvoir appliquer ce théorème, il faut que g soit inversible, i.e. det $2 (a, b) Æ 0. Il ne suffit 
pas que cette matrice soit non nulle. 


Démonstration. Considérons l’ application 


E E i Pad = (ana aan) 


L'hypothèse sur l’inversibilité de 2 (a, b) implique que F'’(a, b) est aussi inversible. Le théorème 


d’inversion locale montre alors que F est un difféomorphisme local près de (a, b). L’ application 
inverse de F' est nécessairement de la forme 


mon) 


Comme F o FT est l'identité, on a g(u, h(u,v)) = v et donc g(u, h(u, 0)) = 0. L’affirmation du 
théorème suit avec y(x) := h(x,0). Comme F est un difféomorphisme local près de (a, b), il n’y 
a pas d’autres solutions de g(x, y) = 0 que celle de la forme (x, w(x)). D 
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Exemple 6.5 Considérons la fonction 


g(x,y) = 16r? — 84x° + 162x — 89 + 27y? + 54ry° — 108y° + 36x°y — 180xy + 162y, 


pour laquelle la condition g(x, y) = 0 donne une courbe nette- 
ment plus compliquée que le cercle de la discussion d’avant 
le théorème. Pour le point (a,b) ~ (1.4,0.5853) sur cette 
courbe (i.e. g(a,b) = 0), on vérifie par un calcul direct que 
(a, b) ~ —3.702 0. Le théorème des fonctions implicites 
implique qu’il existe des voisinages U de a, V de b et une 
fonction différentiable  : U — V tels que (6.4) est vraie pour 
(x, y) € U x V (voir la figure). 

Les points de la courbe ayant une tangente verticale (resp. 
horizontale) peuvent être trouvés par la condition 2 (x, y) =0 


(resp. (x, y) = 0). Au point du croisement, on a nécessaire- 
ment g(x, y) = 0; a(z, y) = 0 et 34 (x,y) = 0 (trois condi- 
tions pour deux inconnues). 


II.7 Surfaces et sous-variétés 


Dans ce paragraphe, nous discutons deux formulations mathématiques différentes de surfaces, et 
nous généralisons les notions de courbes et de surfaces à des objets géométriques (sous-variétés) 
de dimension plus grande. 


Exemples de surfaces dans R. Avant de donner une définition rigoureuse et de discuter 
l’existence des paramétrisations, considérons quelques exemples simples. 


Exemple 7.1 (sphère dans R?) La sphère dans R? de rayon 1, centrée à l’origine, est donnée par 
M = { (£1, £2, £3) |z? +2 + 23 == 0}. 


La sphère, ou une partie de celle-ci, peut aussi être décrite comme l’image d’une des applications 


T1 cos à sin 0 
p(t1,%2) = T2 ou x(a, 0) = | sinasinð 
Le cos 0 


(représentation paramétrique de la sphère). Les images des droites à = Const et 0 = Const sont 
dessinées dans la figure II.5 (gauche). 
Exemple 7.2 (surface cylindrique) La surface cylindrique peut être décrite par 
M = { (£1, £2, £3) | x? + 25 — 1 = 0} 
(voir le dessin du milieu de la figure II.5) ou par une paramétrisation 
p(a,x3) = (cos a, sin a, z3). 


Pour la représentation graphique, on a de nouveau dessiné les images des droite à = Const et 
z3 = Const, ce qui montre l’utilité des représentations paramétriques. 
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Lt 


Figure IIL.5: Surfaces dans R*: sphère, partie d’un cylindre et d’un cône 


Exemple 7.3 (cône) Le troisième objet de la figure II.5 est une partie du cône 


M = {(a1, £2, £3) | £] + £3 — (1 — z3)” = 0}. 


Une représentation paramétrique est 


pla, z3) = ((1 — z3) cosa, (1 — z3)sin a, æ3). 


Exemple 7.4 (tore de révolution) Dans le plan (x1, £3), consi- 

dérons le cercle centré en (d, 0) de rayon p (0 < p < d) et === 
tournons-le autour de l’axe x3. Ceci donne une surface de 
révolution avec la paramétrisation 


(d + pcos à) cos 8 == J 
pla, 8) = | (d+ peos a) sin 8 RE —— 
psina > 
Exemple 7.5 (ruban de Möbius) Considérons une tige de longueur 
2 (paramétrisée par —1 < t < 1) et tournons-la autour de son LÉÈÈESS 
centre et, en même temps, deux fois plus vite autour d’un axe === 


à distance d. Ceci donne la paramétrisation LEE 


(d + t cos à) cos 2a 
p(t,a) = | (d+tcosa)sin2a 
tsinga 


Après tant d’exemples, nous sommes arrivés au point où une définition rigoureuse d’une sur- 
face s’avère utile. Ceci nous permet en même temps d’introduire des objets géométriques d’une 
dimension plus grande. 


Définition 7.6 Un ensemble M  (j est une sous-variété de R” si, pour tout a € M, il existe un 
voisinage U de a (U C R”) et une application différentiable g : U — R”™* avec g(a) = 0 et g'(a) 
de rang maximal n — k tels que 


MNU = {x EU | g(x) = 0}: 


on appelle k la dimension de la sous-variété. 
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Théorème 7.7 (existence d’une paramétrisation locale) Soient M une sous-variété de R” de 
dimension k, et a € M. Alors il existe un voisinage U C R” de a, un voisinage V C R° d’un 
point zo € R* et une application différentiable p : V — U avec (2) = a et £/(20) de rang k tels 
que 

MNU =y¢y(V)= {plz)| zE V}. 


Démonstration. Proche du point a € M, la sous-variété est définie par la condition g(x) = 0, et 
on sait que le rang de la matrice Jacobienne g'(a) est maximal et donc égal à n — k. Après une 
permutation des x; (si nécessaire), on peut supposer que 


og gı 
ET (a) -.. (a) 
| ; est inversible. 

On On 

T (a) ss TEN (a) 
Par le théorème des fonctions implicites, on peut donc localement exprimer £k+1, . . . , £n en fonc- 
tion de z1, ... , £. Avec la notation z := (x1,...,xg), Z0 := (a1, . .., ak), Cty := (Lk41; <; En)’, 
ceci implique qu’il existe une application différentiable G(z) tel que, proche de a, g(x) = g(z, y) = 
0 est équivalent à y = (2). L’affirmation du théorème suit avec p(z) := (2,@(2)). o 


Ce théorème explique le terme “dimension k”, parce que la sous-variété est décrite à l’aide de 
k paramètres car z = (21,...,z)* € RË. Des cas particuliers de sous-variétés de R” sont: 


e k = 1 etn arbitraire: courbe dans R”. Elle peut localement être décrite par une fonction 
p : R — R” comme étant l’image d’un intervalle ouvert, ou par une application g : R” — 
R”! comme étant {x € U | g(x) = 0}. 


e k = 2etn = 3: surface dans R°. Elle est décrite soit par y : R? — R?, soit par g : R? — R 
(voir les exemples 7.1 à 7.5). 


è k =n — l et n arbitraire: hypersurface. Elle est décrite soit par y : R” — R”, soit par 
g:R”—>R. 


Pour mieux comprendre la définition d’une sous-variété, donnons quelques contre-exemples. 
L'ensemble 


M = {(x,y) | zy = 0} 


n’est pas une sous-variété près de (0, 0) car, avec g(x,y) = xy, la dérivée g'(0,0) = (0,0) n’est 

pas de rang maximal. En effet, proche de l’origine, M ne peut pas être décrit comme étant l’image 

d’une fonction différentiable. Par contre, l’ensemble M \ {(0, 0)} est une sous-variété de R°. 
Similairement, l’ensemble M = {o(t)|t € R} avec 


p(t) = (1+0.1#) Fo 


sin t 


n’est pas une sous-variété près de a = (—1 — 0.17°, 0). En effet, il n’existe pas de g : R? — R 
avec g(a) = 0 et g'(a) de rang 1, car sinon il y aurait une contradiction avec le théorème des 
fonctions implicites. Ce contre-exemple montre que l’image d’un intervalle par y : R — R” n’est 
pas toujours une sous-variété, même si y est continâment différentiable avec '(t) Æ 0. 
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IILS Espace tangent 


Courbes. Pour une courbe y : 1 — R” (différentiable et (0) Æ 0), 
la tangente est la droite donnée par T(t) = a + tv où a = (0) et 
v = (0). En déplaçant l’origine au point a, la tangente en a à la 
courbe M = q(T) devient 


TM = {tu|tE R} RS a i 


qui est un espace vectoriel. Dans les variables originelles, la tangente est alors l’espace affine 
a + TaM qui est un sous-ensemble de R”. 


Surfaces dans R?. Comme exemple, prenons l’ellipsoïde 


xr? 2 2 a cos à sin Ÿ 
M= Te y,z)| = + z +— = 1} avec paramétrisation y(a,0)= | bsina sin0 
a c 
c cos 0 


Pour déterminer le plan tangent à un point a = (x0, Yo, z0) = £(@0. 0o) € M, nous considérons les 
courbes paramétriques y(t) = y(t, 0o) et (t) = y(ao, t) dessinées dans la figure I.6. Le dessin 
de gauche montre en plus les tangentes (en gris) T(t) = a + tv avec vı = Yy (ao) et o (t) = a + tv2 
avec Va = ô (do). Les deux vecteurs vı et vz engendrent le plan tangent à l’ellipsoïde. Il est donné 
par a + T,M avec 


TM = {tivi + Lo) | ti, t2 E R} où V1 — Ja (20: 0): Va = gg (20 0). 


Pour d’autres courbes dans M passant par a, la tangente est aussi dans a +7, M (voir le dessin de 
droite de la figure II.6). 


op op 
0 


Figure IIL.6: Illustration de la définition de l’espace tangent 


Définition 8.1 Soient M C R” une sous-variété de R” et a € M. L'espace tangent à M en a est 


TM = fa ER” il existe y : (—€,€) — R” continûment différentiable tel que } 


y(t) € M pour t € (—£, €) et y(0) = a et ÿ(0) =v 


Cette définition donne une jolie interprétation géométrique de l’espace tangent. Pour un calcul 
explicite de 7, M1, les formules du théorème suivant sont plus utiles. 


Théorème 8.2 Soient M C R” une sous-variété de dimension k et a € M. 


e Si, proche de a, M est donné par une paramétrisation locale y : V — R”, c.-à-d. on a 
MNU = {p(2) | z E V} où (20) = a avec zo € V C RŸ, alors 


TM = Img'(20) = {9'(z0)t | t E Rë}. (8.1) 
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è Si M est localement donné par M Q U = {x EU | g(x) = 0}, alors 


TM = ker g'(a) = {v E€ R” | g'(a)v = 0}. (8.2) 


Démonstration. Soit ô(s) une courbe dans R° avec 6(0) = z et (0) = t (par exemple la droite 
Ô(s) = z + st). Alors y(s) := @(Ô(s)) est une courbe dans M satisfaisant (0) = (20) = a et 
7(0) = w'(20) 6(0) = g’/(20) t. Ceci implique Imw'(20) € TM. 

Si y(t) est une courbe dans M satisfaisant y(0) = a et (0) = v, alors g(y(t)) = 0 et 
g'(a)y (0) = 0. Ceci implique T,M C ker g'(a). 

Par définition de la sous-variété M, les deux espaces vectoriels Im ’(2) et ker g'(a) ont la 
même dimension k. On déduit donc des inclusions Imw’(20) C TaM C ker g'(a) les égalités 
Im (20) = TaM = ker g'(a). m 


Ce théorème montre que l’espace tangent T,M est un espace vectoriel de dimension k (même 
dimension que la sous-variété). La formule (8.1) signifie que T, M est engendré par les vecteurs 


Ô ð 
ga o) 5e o) 


(voir les exemples qui précédent la définition 8.1). La formule (8.2) peut aussi être trouvée de la 
manière suivante. Considérons, par exemple, l’ellipsoïde donnée par 


x? y? 22 
a an be 


gy2) = + 


Proche d’un point (£o, Yo, z0) € M, la différentiabilité de g implique que 


2x 2y 2z 
g(£, Y, Z) = g(£0, Yo, Z0) + 7e — £o) + sU — Yo) + at — zo) +.... 


En négligeant les termes supérieurs (les trois points), on obtient la meilleure approximation linéaire 
de g(x,y, z) proche de (x0, Yo, zo). Le plan tangent est donc 

2x0 2Yo 220 

Ce — 20) + Uu-m e-a) 


{(æv.2) 3 


Cela correspond en effet à la formule (8.2). 
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Chapter IV 
Optimisation 


Ce chapitre est consacré à l’étude des maxima et minima d’une fonction à plusieurs variables. On 
dit que f : K — R (avec K C R”) possède un minimum local ou relatif au point a € K si 


f(x) > fla) pour tout x € K N U où U est un voisinage de a. 
Elle possède un minimum global au point a € K si 
f(x) > f(a) pour tout x € K. 


On parle d’un minimum strict si dans ces définitions f(x) > f(a) pour x # a. Pour obtenir des 
résultats concernant les maxima, il suffit de remplacer f par — f. 

Nous allons étudier des minima relatifs dans les cas où K = R” ou une sous-variété de R”. 
Nous discuterons aussi l’ algorithme du simplexe pour le cas où f est une fonction linéaire et X un 
polyèdre. 

Remarquons que le théorème 4.5 du chapitre I nous dit que, si f : K — R est continue et si K 
est compact, il existe toujours un minimum global. Malheureusement, sa démonstration n’est pas 
constructive. 


IV.1 Minima relatifs 


Rappelons que, pour une fonction différentiable f : R — R, la condition f'(a) = 0 est nécessaire 
pour un extremum. Si la fonction est deux fois continûment différentiable, on a 


{ o = . } =>  {minimumrelatifena} => { a = i } (1.1) 


Considérons, par exemple, la fonction 
f(æ) = 0.2x° — 0.075 x — 0.6 x? + 0.3. 


Sa dérivée est f'(x) = x°(x + 1.2)(x — 1.5) et s’annule pour 
a = —1.2, a = O eta = 1.5. En a = —1.2 la fonction f 
possède un maximum relatif (f”(—1.2) = —3.888 < 0), en 
a = 1.5 un minimum relatif (f”(1.5) = 3.825 > 0) et au point 
a = 0 on n’a ni un maximum ni un minimum (f”(0) = 0). 

Le but de ce paragraphe est de généraliser l’affirmation (1.1) à des fonctions à plusieurs vari- 
ables. Comme (1.1) se démontre à l’aide de la formule de Taylor, nous rappelons brièvement les 
premiers termes de la série de Taylor pour une fonction à plusieurs variables. 
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Pour une fonction f(x) = f(x1....,2,) qui est deux fois continûment différentiable, la série 
de Taylor avec reste sous forme intégrale (voir aussi (II.4.10)) est 


Jato) = fa)+fov+ | G-a + tolo v)at 
= JOHO) | a-ha to) - O) o) dt 


En utilisant le fait que ||(f”(a + tv) — f(a))(v,v)|| < | f” (a + tv) — f"(a)l||- lv]? et que toutes 
les deuxièmes dérivées partielles sont continues en a, nous obtenons 


fla +v) = f(a) + f'(a) v + > f(a), v) +r)? 


où r(v) — 0 si v — 0. Comme f(x) est une fonction scalaire, cette formule peut aussi être écrite 
sous la forme 


fla +v) = f(a) + Vfla)jv + > v'H(a) v+ r(v)|jv]? (1.2) 
ou 
BL (x) TE (a) a (0) 
V f(x) = ; et H(z) = V’ f(x) = : : 
2 (x) EG) … Ho) 


Le vecteur V f(x) est le gradient de la fonction f(x) et H(x) est sa matrice Hessienne. Cette 
matrice est symétrique car les deuxièmes dérivées partielles ne dépendent pas de l’ordre de la 
différentiation. C’est surtout la formule (1.2) qu’on va utiliser pour la suite. 


La généralisation de l’affirmation (1.1) est la suivante: 


Théorème 1.1 Soient f : R” — R deux fois continûment différentiable et a € R”. Alors on a 


Vf(a) = 0 f possède un Vf(a) = 0 
H (a) est définie positive minimum relatif en a H (a) est semi-définie positive 
Démonstration. Rappelons que si Amin est la plus petite valeur propre d’une matrice symétrique 
H,ona 
v'Hv > Aminvu pour v €R”. (1.3) 
Ceci est une conséquence immédiate du corollaire IL.2.6. 
Pour V f (a) = 0, la formule de Taylor (1.2) et l’estimation (1.3) impliquent que 


f(a+v) — f(a) > (Amin + 7(v)) ljo]. 


Si Amin > 0 (c.-à-d. si la matrice H (a) est définie positive), on a f(a + v) > f(a) pour v # 0 
suffisamment petit. On a même démontré que a est un minimum strict. 

La condition nécessaire de l’affirmation du théorème est une conséquence de (1.1) appliqué 
la fonction g(t) = f(a + tv). 


0O w 


Corollaire 1.2 Situation comme dans le théorème 1.1. Alors on a 


Vf(a) = 0 f possède un x Vf(a) =0 
—H (a) est définie positive maximum relatif en a —H (a) est semi-définie positive 
Démonstration. Cette affirmation est une conséquence immédiate du théorème 1.1, car f possède 
un maximum en a si et seulement si — f possède un minimum en a. D 
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P l | ns % 
Exemple 1.3 Cherchons les minima relatifs de la fonction n — N 
faite) = 29 + T3 — Fri = 
(folium cartesii). Ses courbes de niveau sont dessinées dans la w 
figure d’à côté. On commence par calculer le gradient 
3x? — 312 
Vf) = 
Fi) o — 3x1 ) = 
et les valeurs de a où Vf(a) = 0. Pour cet exemple simple, < 
on trouve tout de suite a = (0,0) et a = (1,1). Pour des fonc- V> 
tions plus compliquées, on est obligé d’utiliser des méthodes > i 
numériques. 
Pour vérifier s’il s’agit d’un minimum, nous calculons la matrice Hessienne 
= 6x: —3 
He e a ; 
Le valeurs propres de H (a) sont les zéros du polynôme caractéristique (À — 6a) (À — 6a2) — 9. 
Au point a = (0,0), nous trouvons À = —3 et À = 3 comme valeurs propres de H (a). Il ne 
s’agit donc ni d’un minimum ni d’un maximum, comme on peut le voir sur le dessin. Par contre, 
les valeurs propres de H (a) pour a = (1,1) sont À; = 3 et À2 = 9. Comme elles sont positives, il 
s’agit d’un minimum relatif. 


Remarquons que, pour une fonction f : R” — R, la condition V f(x) = 0 donne n équations 
à n inconnues à résoudre, notamment 


Of = f E 
ga (Tho Tn) = g is oa a a 


Pour vérifier si une solution a € R” représente un minimum relatif de f(x), il faut calculer les 
valeurs propres de la matrice Hessienne H (a). Les deux problèmes (la résolution d’un système 
non linéaire dans R” et le calcul des valeurs propres d’une matrice de dimension n) seront traités 
dans le cours ‘Analyse Numérique”. 


IV.2 Minima conditionnels — multiplicateurs de Lagrange 


Pour mieux comprendre les idées, commençons par le problème 


VA 
(ti, £2) = £1£2 — min 
sur M = { (x1, £2) | g(£1, £2) := £? + x3 — 1 = 0}. a 

On voit sur le dessin d’à côté que les solutions de ce problème 
sont (=%, 2) et (2, =). 
Raisonnement géométrique. On sait que V f (a) est orthogonal 
aux lignes de niveau car f (a+v)— f(a) = Vf(a)*v+O(|v|?). 
De plus, Vg(a) est orthogonal à M (formule (8.2) du para- 
graphe II.8). Si la courbe de niveau de f(x) et la sous-variété 


M se coupent transversalement en a, on ne peut pas avoir un 
minimum. Donc, aux solutions de ce problème, on a 


VJ(a) = A Vy(a). 
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Raisonnement analytique. La sous-variété M = {(x1,x2)|x?+x3—1 = 0} peut être paramétrisée 
à l’aide de y(t) = (cost, sint)*. Le problème qui consiste à minimiser f(x) sur M est alors 
équivalent à minimiser la fonction F(t) = f(p{t)) = costsint = $sin 2t sur R. La condition 
F" (t) = cos 2t = 0 est satisfaite pour t = 1/4, 31/4, 5/4, etc. Comme F”(t) = —2 sin 2t, les 
minima sont obtenus pour t = 37/4 et pour t = 77/4. 

Pour une fonction arbitraire f (x1, x2) et pour une sous-variété de R° donnée par une courbe 
paramétrique y(t), l'approche analytique donne pour F(t) = f(p(t)) la condition 


FE) = Fe) pE) = VEE) EE) = 0. 
Avec l'interprétation géométrique, on a donc au minimum: 
Vf(a) L tangenteà Mena &  Vf(a)| Va(a) ©  Vf(a) = AVg(a). 
Le but est de généraliser cet exemple à une fonction f de n variables et à une sous-variété arbitraire 


de R” de dimension kK. 


Le problème à traiter dans ce paragraphe est alors le suivant: soient données une fonction 

f : R” — R continôment différentiable et une sous-variété M de dimension k. Calculer les 
solutions de 

f(x) — min sur M, (2.1) 


c.-à-d. on cherche a € M tel que f(x) > f(a) pour x € M proche de a. On dit aussi que a € M 
est un minimum relatif de la fonction f|m (restriction de f à M). 


Théorème 2.1 Soit f : R” — R deux fois continûment différentiable et soit p : Rë — R” une 
paramétrisation locale de M près de a € M (et (20) = a). Alors 


Vf(a)‘v'(20) = 0 et z flu possède un 2 V flao (z0) = 0 et 
H est définie positive minimum relatif en a H est semi-définie positive 
où H est la matrice Hessienne de l'application z + f(w(z)), c.-à-d. 


n 


H := (20) V2 f(a) £/(20) + 2 mN V'ei(2o). (2.2) 


Notons que la matrice Hessienne V? f(a) de la fonction f est de dimension n, mais que la 
matrice H est seulement de dimension k. 


Démonstration. La restriction de la fonction f sur M possède un minimum relatif en a € M si et 
seulement si F(z) := f(p(z)) en possède un en z,. En observant “ue F"(2) = f'(v(2))w'(2) = 


V Flle) (x) et que VF (2) = pa) V2 f(0(2)) (2) + DL lole) Vyle), l'affirmation 
est une conséquence du théorème 1.1. m 


Si on veut éviter la notation matricielle, la condition F” (z0) = V f(a)fp' (z0) = 0 s’écrit 


a a PN 
a => Jz (zo) = 0 pour i= 1,...,k 


et les éléments de la matrice H = V? F (zo) sont 


o T æ o o 7 R 
Lla) = E gio Ee) SEE (70) + D La PE (20) 


E 0x;0z; (z) = FE ox Orp à Ozi a = oxı 040% 
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Ce théorème donne un critère satisfaisant si la sous-variété M est donnée par une paramé- 
trisation. Mais dans la plupart des applications, la sous-variété est donnée sous la forme M = 
{x € R” | g(x) = 0}. Le but est alors d’exprimer les conditions nécessaires et suffisantes du 
théorème 2.1 en termes de g(x) et non de w(z). 


La condition sur la première dérivée. La condition V f(a)‘/(20) = 0, i.e. V f(a)‘s'(zo)v = 0 
pour tout v € R¥, signifie que le vecteur V f (a) est orthogonal à l’espace tangent T, M (voir la 
formule (8.1) du paragraphe II.8). Il suffit d’utiliser la formule (8.2) du paragraphe II.8 qui dit 
que T,M = ker g'(a) et un théorème du cours d’ Algèbre! pour conclure que V f(a) € Im g'(a)t. 


Ceci implique qu’il existe À = (A1,...,À,,)' tel que 
Vf{a) = g'(a)' À = X` XV (a). (2.3) 
Ici, on dénote par g(x) les composantes de la fonction g : R” — R™. Les paramètres À1,..., Àm 


s'appellent les multiplicateurs de Lagrange. En introduisant la fonction de Lagrange 
L(x, à) := f(æ) — 'g(x) = f(x) — X. Aga), (2.4) 


cette condition devient V,£ (x, À) = 0, où V, dénote le vecteur des dérivées partielles par rapport 
aux composantes de x. En résumé, un point a € M satisfait la condition V f (a)fp' (z0) = 0 du 
théorème 2.1 si et seulement si (a, À) est solution du système 


VL (zx, À) = 0, g(x) =0. (2.5) 
Il faut donc résoudre ce système à n + m conditions pour n + m inconnues (x € R” et À € R”). 


La condition sur la deuxième dérivée. Essayons maintenant d’écrire la condition “H est définie 
(ou semi-définie) positive” du théorème 2.1 seulement à l’aide de la fonction g(x). 


Comme on a g(w(2)) = 0, en dérivant par rapport à z;, on obtient X `; 52 dax SE = = (eten dérivant 


` : o : 212 
une deuxième fois, on obtient X`, „ 3g- S2 2 + 57 feel = 0. En utilisant (2.3), l'élément 


(i, j) du deuxième terme de (2.2) est donc 
Per o gk y D gx di 9 
>. ne IT (z0) = D Mg (0) EPA nr Inar, ® TE (zo) ga (0) 


L'expression à étudier devient alors 


v'H v = vg’ (z0) (V? DEC )}e (zov. 


En posant w = ọ'(zo)v et en utilisant T, M = Im ọ'(zo) (voir le paragraphe II.8), la condition 
“vt H v > 0 pour v € R'” devient 


wV? L(a, À) w = wt (V? fla) = Y X V?gla))w >0 pour wET,M. 
k=1 


Celle-ci ne dépend plus de la paramétrisation p(z) mais uniquement de g(x). 


l Rappel du cours d’Algèbre. Pour une matrice arbitraire A on a (ker A)+ = ImAt. On utilise ici la notation 
V+ = {w € R” | wtv = 0 pour tout v € V}. 
Démonstration. Ceci suit des équivalences v € ker A & Av=0 & wtAv—=Opourtoutw & v L Atw pour 
toutw & vLlimAt & ve (ImAt) et du fait que (V+)+ = V. 
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Nous avons alors démontré le résultat suivant: 


Théorème 2.2 Soient f : R” — R suffisamment différentiable, M = {x € R” | g(x) = 0} une 
sous-variété, a € M et A E€ R”. Avec L(x, A) donnée par (2.4), on a alors 


V.L(a, À) = 0 et 
wV? L(a, À) w > 0 
pour w E€ T,M, w # 0 


VL (a, À) = 0 et 
wV? L(a, À) w > 0 


minimum relatif en a 
pour w € T,M. o 


. { flu possède un } 


Corollaire 2.3 Situation comme dans le théorème 2.2. Alors on a 
VL (a, À) = 0 et 
wV? L(a, À) w < 0 
pour w E€ TM, w #0 


V.L(a, À) = 0er 
wV? L(a, À) w < 0 


l flu possède un } 
— 5> 
pour w € T, M. o 


maximun relatif en a 


Exemple 2.4 Considérons un parallélépipède droit dont la largeur, 


la profondeur et la hauteur sont respectivement x1, £2 et x3. Le 

problème consiste à maximiser le volume f(£1, £2, £3) = £1£2%3 A - r 
tout en gardant le périmètre constant et égal à P (i.e. la sous-variété Pa $ 
M est donnée par g(£1, £2, £3) = 4x1 + 4x9 + 4x3 — P = 0). La fo 


fonction de Lagrange pour ce problème est 


L(x, À) = £1£2£3 — A(4x1 + 4x2 + 4x3 — P) 


et la condition nécessaire (2.5) devient 


Lot — 4 = 0 
Z123 — 4 = 0 Ati + 4x2 + 4x3 — P = 0. 
zizo — 4A = 0 


Les solutions de ce système sont (P/4,0,0), (0, P/4, 0), (0,0, P/4) avec À = 0 dans chaque cas 
et (P/12, P/12, P/12) avec À = P?/576. Il est facile de deviner que le volume est maximal pour 
T1 = z2 = z3 = P/12, mais vérifions tout de même la condition suffisante du corollaire 2.3. Pour 
ceci, nous calculons 


0 T3 T2 
VL(z, A) = | z3 0 "x 
Tao Tı 0 


ainsi que l’espace tangent pour M = { (z1, £2, £3)* | g(x1, £2, £3) = 0}: 
T, M = {(v1, vo, vs) | v1 + vo + v3 = 0} = (1, —1, 0), (1,0, —1)*). 
La condition wt’ V? £ (a, À) w < 0 pour w € TaM, w Æ 0 est alors équivalente à la propriété que 
1 —1 0 cd l l —2%3 Tı — T2 — T3 
1 0 —1 Ta M 4 Pr ~ (i-r 2 
Tao Tı 0 0 =1 1 ‘ 3 2 


soit définie négative. Cette condition est satisfaite pour le point (P/12, P/12, P/12). Pour les 
autres trois points critiques, les deux valeurs propres de cette matrice sont de signes opposés. 
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Exemple 2.5 Cherchons à minimiser la fonction f (£1, £2, £3) = £1 — £2 — T3 sur la sous-variété 

M = {(£1, £2, ta) | £? + 2x5 — 1 = 0, 3x1 — 4x3 = 0}. Cette dernière représente l’intersection 

d’un cylindre vertical avec un plan, c.-à-d. une ellipse dans l’espace. La fonction de Lagrange est 
L(x1. T2, T3, À, A2) = LI = DS T3 — A(z? F 2x7 = 1) = A(3T: —= 4x3) 

et la condition nécessaire (2.5) devient 


Lame SU ét 


—] — 41% = 0 E 
-1 +4% =0 EN 
dont les solutions sont 
1 3 1 P sai 
À2 — 4! A = tz, Tı = Ez, T2 = T3? T3 = +7. (2.6) 


On aimerait déterminer laquelle de ces deux solutions représente un minimum (ou maximum) de 
la fonction f. Nous calculons alors 


2 0 
VL(xz,})=-X|0 4 
0 0 


ee CS: 


et l’espace tangent pour M (au points de la solution (2.6)) 
TaM = {(v1, v2, v3) | 2x101 + Atovo = 0, 3u1 — Aus = 0} = ((4, 1, 3)). 


Avec w := (4,1,3)' on a wV? L(x, \)w = —36\. La fonction f est donc minimale sur M au 
point (—1/3, 2/3, —1/4)' où À est négatif et elle est maximale sur M au point (1/3, —2/3, 1/4)'. 


IV3 Contraintes en forme des équations et inéquations 


On cherche des conditions nécessaires et suffisantes pour un problème encore plus général qui est 
le suivant: soient f : R” — R, g : R” — R” eth : R” — R* continûment différentiables; 
trouver les minima relatifs du problème 


f(x) — min sur K = {x € R” | g(x) =0, h(x) > 0}. (3.1) 


La condition “h(x) > 0” signifie que tous les composantes de h(x) doivent être non négatives, 
c.-à-d. h;(x) > 0 pour j = 1,..., k. Supposons pour le moment que K soit uniquement donné 


par des inéquations h(x) > 0. 
Exemple 3.1 Considérons la fonction 
f (£1, £2) = r3 + r3 — 3£1T2 
qui nous est familière de l’exemple 1.3 et cherchons ses minima (et maxima) relatifs sur l’ensemble 
K = {(x1, £2) | 4— 1f — £3 > 0, — z + 1.2 > 0, (zı — 0.5) (£2 — 2.2) + 1 > 0}. 
Pour résoudre ce problème, nous le séparons en plusieurs sous-problèmes. 


e Étudions d’abord les points critiques de la fonction f (x1, x2) sans tenir compte de l’ensemble 
K. Ceux qui sont par hasard dans K, sont aussi des extrema de la fonction f|x (restriction 
de f sur K). Dans notre situation (voir exemple 1.3), ceci est le cas pour le minimum relatif 
a = (1,1) ainsi que pour le point de selle a = (0, 0). 
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e Ensuite, il faut considérer le bord de K. Comme il con- 
siste en plusieurs courbes lisses, commençons à étudier 
f sur le cercle Mı = {(x1,x2) | 4 — x? — zł = 0}. À 
l’aide de la fonction de Lagrange 


> ER EN 
S® min. rel o max. rel 


Lt, da, À) = T} + T3 — Brit — A(4 — xf — z3), 


nous trouvons (— v2, — v2) et trois autres solutions à 
l'extérieur de K. Le dessin nous montre qu’il s’agit 
d’un minimum (global). En procédant de la même ma- 
nière avec les autres courbes du bord de K, nous obtenons 
(—v1.2, 1.2) et (0.8315, —0.8159) comme maxima re- 
latifs, et les points (v1.2, 1.2) et (1.2797, 0.9175) qui 
sont des minima sur 0K mais pas sur K. 


e Finalement, nous devrons étudier les sommets de K. En inspectant la figure, nous voyons 
que le point (1.5, 1.2) est un maximum relatif de f sur K. 


IV.4 Programmation linéaire 


Les problèmes convexes les plus simples et les plus importants sont ceux où toutes les fonctions 
sont linéaires (affines). Nous commençons par un exemple de petite dimension qui permet une 
interprétation et une résolution graphique. L'intérêt principal des paragraphes IV.4 et IV.5 est de 
développer un algorithme qui permet de résoudre n’importe quel problème de la programmation 
linéaire dans une dimension arbitraire. 


Exemple 4.1 Une entreprise possède 2 garages Gi et G2 
avec 8 et 6 camions respectivement. Elle travaille sur deux © 
chantiers C4 et C2. Le chantier C4 exige 4 camions et le 
chantier C2 exige 7 camions. Les distances sont données 
sur le schéma d’à côté. Comment faut-il organiser les trajets 
pour minimiser les consommations d’essence? 
Pour une formulation mathématique du problème, no- Cr, Pi 
tons par z1, £2, £3 et x4 le nombre de camions allant de G: © 
à C1, de G1 à C2, Go à Ci et de Go à C2 respectivement. 
Nous avons les conditions 


9 km 5km 


Ti + T2 <8, T3 + Ta < 6, TK, Lo + Ta = 7 et zx; > 0 


et la fonction objective est 


8t1 + 9x2 + 3x3 + 5T4 — min. 

On peut simplifier le problème en éliminant 
£3 et T4 car £3 = 4 — xı et z4 = 7 — x2. On 
obtient alors 

5x1 + 479 + 47 — min 
Tı + T2 < 8 
—L1 — Lo < —5 
z<4, 20 
z2 LT, Le 0; 
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En regardant les droites où f(x) = 5x1 + 4x2 + 47 est constante (lignes traitillées), on trouve 
immédiatement la solution du problème: xı = 0, £2 = 5, £3 = 4, £4 = 2. 


Formulation du problème général. Nous considérons la résolution du problème suivant: 


C1T1 + Co +... + Cnn — Max 
aiti +... + Ginln < bi ct — max 
=. ou Ax <b (4.1) 
am1g1 +... + Amn£n < bm z > 0 
zı > 0,..., 23n >20 


D’autres problèmes de la programmation linéaire peuvent être écrits sous cette forme: 
e La condition c'x — min est équivalente à (—c)'x — max; 
e Une équation peut être remplacée par deux inéquations; ou mieux encore: éliminer des 
variables comme dans l’exemple précédent; 


e Une variable xı, sans restriction sur son signe, peut être écrite comme zı = de — ZX] où 
x) > Oetx, > 0. 


Un algorithme possible mais pas recommandé. L’ ensemble, où on cherche à maximiser la 
fonction objective f(x) = c'x, est le polyèdre K = {x € R” | Ax < b, x > 0}. Comme f(x) 
est linéaire, une solution est certainement sur un des sommets de X. Pour la trouver, on pourrait 
procéder de la manière suivante: 


e calculer tous les sommets du polyèdre (le nombre de sommets est fini); 
e déterminer le sommet où f(x) = ctx est maximal. 


L’algorithme que nous allons présenter dans le paragraphe suivant est une procédure intelligente 
qui permet d’éviter le calul de tous les sommets du polyèdre. Néanmoins, nous sommes obligés 
de formuler mathématiquement les sommets du polyèdre. C’est notre but pour le reste de ce 
paragraphe. 


Variables d’écart (variables artificielles). On pose y = b — Ax où y € R”. Pour un x € R” 
donné, y; mesure son écart (distance) à l’hyperplan D aij&j — bi = 0. Le problème (4.1) est 
donc équivalent à 

čz — max, Ar+y=b x>0, y>0. (4.2) 


Cette reformulation nous permet de calculer systématiquement les sommets du polyèdre K = 
{x ER" | Ax < b, x > 0}. Illustrons ceci avec le problème de l’exemple 4.1. 


Exemple 4.2 Nous introduisons des variables 
d'écart y1,..., Y4 pour les quatre inéquations 
du problème de l’exemple 4.1. Ceci donne 


T1 + La + Yi = 8 
Ti — T2 + Y2 = —9 
zı + Y3 = 4 
TI+y=7 


et on a 4 équations à 6 inconnues. Chacune des 
conditions x; = 0 et y; = 0 correspond à une 
droite sur le dessin d’à côté. Si l’on pose deux 
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variables parmi £1, £2, Y1...., Y4 égal à zéro, on obtient les intersections de deux droites et, parmi 
elles, les sommets du polyèdre. Il y a (i) = 15 possibilités d'annuler deux variables. On obtient 
ainsi les 5 sommets du polyèdre et les 7 autres intersections; 3 couples ne donnent pas de solution 
(droites parallèles). 


Cet exemple nous montre que, pour le calcul des sommets du polyèdre, on traîte les vari- 
ables x; et y; équitablement. Il n’y a donc pas de raison de distinguer les deux types de vari- 
ables. Rassemblons-les donc toutes dans un vecteur z = (£1,..., En; Y1,..., Um) et écrivons le 


problème (4.2) sous la forme j 


OO 


(č, 0) z — max, (A, IĪ)z=b z>0 avec (A, I)= (4.3) 


DH ODD 
= © Se © 


1 1 
—] —1 
1 0 
0O 1 


© 
OD OT 


(pour le système de l’exemple 4.2). Nous constatons que l’annulation de deux variables parmi 
T1, £2, Y1,..., Ya COrrespond à une intersection réelle si et seulement si la matrice carrée, obtenue 
en supprimant les deux colonnes correspondantes, est inversible. Si, en plus, les composantes de 
la solution de (A, T) z = b sont non négatives, alors cette intersection est un sommet du polyèdre. 

Dans le problème (4.3) nous écrivons de nouveau c‘ au lieu de (c!, 0‘), A au lieu de (A, T) et 
x au lieu de z. Le problème devient alors 


cit — max 
Az = b (4.4) 
zæ>0 


où x ER",cER",bE R™ etn > m. Nous supposons (sans perdre la généralité) que le rang de 
la matrice À soit m (maximal). Sinon, soit le système Ax = b ne possède pas de solution soit une 
ou plusieurs équations du système peuvent être supprimées sans changer les solutions. 


Notations. Par la suite, nous noterons A; € R™ la jème colonne de la matrice A. Nous parti- 
tionnons les indices {1,...,n} = B U R en deux sous-ensembles disjoints dont B = {i1,...,im} 
contient m éléments et À = {ÿ1,..., jn-m} Contient le reste. Nous partitionnons également les 
vecteurs c, x et la matrice À de la manière suivante: 


Ap — (Au, cs Ain) Ar = (Aj, ; Ainm) 
TB — (sus ns TR Z is dia 
CB — (ess PRE Cu CR — (Cj, SED C 


Ainsi, Ag est une matrice carrée de dimension m. Le problème (4.4) devient alors 


ChTtp + Chir — Max 
Agtz + Artr = b (4.5) 
TB > 0, TR > 0. 


Définition 4.3 (base) Un sous-ensemble B = {i1,...,im} C {1,...,n} à m éléments s’appelle 
une base, si A3 est inversible, c.-à-d. si det Ag # 0. Pour une base B, le vecteur 


a TB — AS 
ORES «o 


s’appelle solution de base (associée à B). Elle est dite admissible si Ab > 0. 
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L'interprétation géométrique de cette définition est la suivante: l’ensemble {x| Ax = b} 
représente un espace affine de dimension n — m (car A est une matrice m x n de rang maxi- 
mal m) et l’ensemble {x | Ax = b, x > 0} est un polyèdre dans cet espace. Pour une base B du 
problème, la condition £R = (x,,....,7;, ,) = 0 représente l’intersection de n — m hyperplans 
qui sont des faces du polyèdre. Les solutions de base admissibles sont donc en bijection avec les 
sommets de ce polyèdre. 

Par exemple, {y1, Y2, Y3, ya} (ou plus précisément l’ensemble {3,4,5,6}) est une base du 
problème de l’exemple 4.2. Elle correspond à l’origine qui est l'intersection de x, = 0 et de 
£2 = 0. La base {x1, £2, Y2, Y3} correspond au sommet (4, 4) qui est l’intersection de y, = 0 et de 
y3 = 0. L'ensemble {x1,%2, Y3, ya} ne constitue pas une base parce que la matrice formée par les 
deux premières et les deux dernières colonnes de (4.3) n’est pas inversible (les droites y, = 0 et 
Y2 = 0 n’ont pas d’intersection). 


Reformulation du problème. Par élimination des variables £g, c.-à-d. en utilisant la relation 


Tg = -Åg Artr + A5'b, le problème (4.5) devient équivalent à 
(c Ap Ar + chtr + CHAR b — max utťR — 2 — max 
Ap ARTIR < A5'b ou Sırt (4.7) 


où S = Ap Ar, t = Ab, ut = -ch Ap Ar + ci, et z = -é Ab. 


Tableau du simplexe. Nous rassemblons toute l’information de la formulation (4.7) dans le 
tableau suivant: 


(4.8) 


La solution de base pour le premier tableau n’est pas admissible (le vecteur t = A,'b possède 
des composantes négatives) mais celles du deuxième et du troisième le sont et correspondent à des 
sommets du polyèdre (voir le dessin de l’exemple 4.2). 


Théorème 4.4 (critère du simplexe) Soit B une base du problème 


cr — max 
Ax = b et 
zæ>0 


le tableau du simplexe correspondant. 


Si t > 0 et u < 0, alors £g = t, £r = 0 est solution du problème. 
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Démonstration. Comme t > 0, la solution de base associée à B est admissible. De plus, pour un 
point x satisfaisant Ax = b et x > 0, la conditon u < 0 implique 


fa) = Du; -z< 2 = f(( 7 Je 


Cette solution de base est alors une solution du problème d’optimisation. m 


Le troisième tableau de (4.8) vérifie le critère du simplexe (t > O etu < 0). La solution de 
base associée xı = 0 et z2 = 5 est donc une solution optimale du problème de l’exemple 4.2. 

Pour se convaincre que l’algorithme (non recommandé) du début de ce paragraphe n’est pas 
réalisable, considérons le cas où n = 20 et m = 10 (en pratique on est confronté à des dimensions 
beaucoup plus grande). Il y a 6) = 184756 possibilités de choisir 10 parmi les 20 colonnes de 
la matrice À. Le calcul de toutes les solutions de base pourrait ainsi exiger la résolution d’environ 


180 000 systèmes linéaires de 10 équations à 10 inconnues. 


IVS L’algorithme du simplexe 


The author wishes to acknowledge that his work on this subject stemmed from discussions 
in the spring of 1947 with Marshall K. Wood, in connection with Air Force programming 
methods. The general nature of the “simplex” approach (...) was stimulated by discussions 
with Leonid Hurwicz. (G.B. Dantzig 1951) 


L'idée de suivre les arêtes d’un polyèdre pour optimiser une fonction linéaire sous contraintes 
linéaires a déjà été envisagée par J. Fourier’. Dantzig cependant la systématise. 
(J.F. Maurras 20023) 


L’algorithme du simplexe a été publié par Dantzig comme chapitre XXI dans un compte rendu 
d’une conférence*. C’est une procédure itérative permettant d’effectuer une exploration dirigée des 
sommets du polyèdre en suivant des arêtes jusqu’au sommet qui maximise la fonction objective. 
Cet algorithme est parmi les “Top 10 Algorithms of the 20th Century” (SIAM News, Vol. 33, Nr. 4, 
May 2000). 

Le théorème suivant donne les formules qui, en partant d’un tableau du simplexe, nous permet 
d’obtenir le tableau associé à un sommet voisin. 


Théorème 5.1 Soit B une base du problème (4.4), R={1,...,n}\BkeB,leRer 


(5.1) 


le tableau du simplexe correspondant. Si sxy Æ O (pivot), alors 
o B = B U {1} \ {k} est une base. 


2J.B.J. Fourier, Solution d’une question particulière du calcul des inégalités, Nouveau Bulletin des Sciences par la 
Société Philomathique de Paris (1826) 99-100. 

3J.F. Maurras, Programmation Linéaire, Complexité, Séparation et Optimisation, Mathématiques & Applications 
38, Springer, Paris, 2002. 

4G.B. Dantzig, Maximization of a linear function of variables subject to linear inequalities, Activity Analysis of 
Production and Allocation (T.C. Koopmans, ed.), Wiley, New York, 1951, 339-347. 
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e Le tableau qui correspond à B est donné par 


Voici une astuce pour retenir cette formule: 


5 Le 1 a 
pP q P q — p p 
r s T S > Sir 
Démonstration. La k ème composante de l’équation xp + Szr = t est £k + Der RE = tk. 
Comme sx, # 0, on peut en extraire x, (l € R, fixé) et on obtient 


1 sS t 
Tı + = Lk + ) ki y = eLA 
Skl Skl Skl 
JERU} 


(voir la ligne “Į” du tableau pour B). En remplaçant x, de cette formule dans la ième composante 
de xp + Szr = t (i € B \ {k}, on obtient 


1 Skj A = Se 

Ti + Sil (— Tk — y P au Tj + =) + D SijT j = ti OU Ti + SikTk + ` SijTj = ti 
# jem ™ #7 jer\(r JER 

ce qui vérifie la ligne “?” du tableau pour B. La dernière ligne du tableau est obtenue de la même 

manière. z 


Les formules du théorème précédent donnent un moyen simple et efficace pour calculer des 
tableaux du simplexe à partir d’un tableau connu. Il reste à éviter le calcul des tableaux inutiles. 


Algorithme du simplexe. Soit donné un tableau (5.1) avec t > 0, c.-à-d. la solution de base as- 
sociée est admissible. Alors, le programme suivant nous permet de trouver une solution optimale: 


begin 
if (u < 0) then 
on a trouvé une solution du problème, stop 
else 
choisir l € R avec w > 0 
if (sy < 0 pour tout ¿ € B) then 
pas de solution, la fonction objective n’est pas majorée, stop (voir explication 1) 
else 
choisir k € B tel que Æ = min{# |i € B, su > 0} 
échanger k et l avec les formules du théorème précédent; 
on obtient un nouveau tableau avec base B = B U {1} \ {k} qui satisfait 
T> 0et—2 > —z (voir explication 2) go to begin 
end if 
end if 
end 
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Explications. 

1. Siu, > O(pourunlE R) et sy < 0 pour tout i € B alors la fonction objective n’est pas 
majorée sur l’ensemble des points admissibles. 

Démonstration. Considérons le rayon xx(a) défini par (a) = a (a > 0) et x;(a) = 0 pour 
j E€ R\ {1}. Alors zr(a) > Oet Sxr(a) = a(...,sy,...)" < 0 < t. Les points du rayon xz(a) 
sont donc admissible pour tout œ > 0 et 


f(a(a)) = u'xr(a)-z = uaz => © si a — 00. m 


2. Le choix de let de k dans l’ l'algorithme conduit à un tableau avec F> 0 et avec —2 > —z. 
Démonstration. Nous avons t, = = > 0 parce que t > 0 et sy > 0 et pour i € B \ {k} 


A t TRS {© > ti > 0 si Sil < 0 
i | Skl = sl = =) > 0 si Sy > 0. 
De plus, ona —? = —z + %4 > —z car u > 0, tp > 0 et su > 0. m 


Exemple 5.2 Considérons le problème 


2z1ı + £2 — max 
Ti T 2%) < 10 


zı + To < 6 


T1 — Lo < 2 
zı — 2%9 < 1 
zı > 0, z2 > 0 


et appliquons l’algorithme du simplexe. 

Nous introduisons les quatre variables d’écart y1, Y2, Y3, ya pour les quatre inéquations. Ceci 
donne un problème de programmation linéaire avec m = 4 équations et n = 6 variables non 
négatives. Les variables y1, Y2, Y3, ya constituent une base, dont la solution associée zı = z2 = 0 
est admissible. Cette base nous donne un tableau de départ pour l’algorithme du simplexe: 


MEME D EPA DT EE MEET 


Dans le premier tableau, le deux composantes de u sont positives et on a le choix entre x et 
£2, C.-à-d. on peut soit aller vers le sommet (1,0) (c’était notre choix) soit vers le sommet (0, 5). 
Dans les autres étapes, le pivot est unique. Il nous faut trois itérations pour un tableau qui satisfait 
le critère du simplexe. La solution du problème est x, = 4, x2 = 2 et la valeur maximale de la 
fonction objective est f (£opt) = 10. 
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Construction d’une solution de base admissible. L’algorithme du simplexe nécessite la con- 
naissance d’une base avec t > 0 (solution de base admissible). Dans un problème 


nm 
čz — max Di GTi > max 
Az < b ou de manière équivalente Yi + D dit = bi (5.2) 
aN EE EA 
avec b > 0, les variables y1, ..., Ym forment une base dont la solution associée est admissible. 


On peut alors immédiatement appliquer l algorithme du simplexe. 


Si, par contre, au moins une composante du vecteur b est négative, il faut une astuce supplémentaire 
pour trouver un tableau de départ. L’idée est de supprimer les inéquations avec b; < 0 (pour que 
l’origine devienne un point admissible, voir le dessin de l’exemple 5.3) et ensuite de minimiser 
l'écart de celles-ci. Cela revient à considérer le problème auxiliaire 


Yi + ee Qijtj = b; si b; > 0 
Vi — À + Yi QijTj = b; si b; <0 
yvi 20, 4 20, x >0 


— J; 2i > max 


(5.3) 


Ce problème auxiliaire a les propriétés suivantes: 


e L'ensemble des variables {y; | b; > 0} U {z; | b; < 0} forme une base de (5.3) avec solution 
associée x; = 0, y; = 0 si b; < 0, y; = b; si b; > 0 et z; = —b; si b; < 0. Cette solution 
satisfait x; > 0, y; > 0, zi > 0. Elle est donc admissible et fournit un tableau de départ pour 
l’algorithme du simplexe appliqué à (5.3). 


e La fonction objective — J`; z; est majorée par zéro parce que z; > 0. Le problème auxiliaire 
admet donc une solution finie. 


e Pour la solution ainsi trouvée on a deux possibilités: 
(a) $; zi = 0, c.-à-d. z; = 0 pout tout i. Dans cette situation, les valeurs x; et y; satisfont 
les contraintes du problème original (5.2). On a donc trouvé une solution de base admissible 
pour (5.2). 
(b) Xz; < 0. Si le problème (5.2) avait un point (x,y) satisfaisant les contraintes, la 
solution de (5.3) aurait z = 0 comme solution. L’ensemble des points admissibles pour (5.2) 
est donc vide dans cette situation. 


T2 


Exemple 5.3 Considérons de nouveau le problème 
de l’exemple 4.1 pour lequel le vecteur b possède 
une composante négative. Le problème auxiliaire 
devient alors 


—Z1] — Max 

Yı + Li + Lo = 8 

Y2 — 21 — Tı — T2 = —5 

y+r=4 i 
1 

+ to = 7 

Ya 2 6 A 
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Comme proposé tout à l’heure, nous prenons la base B = {y1, 21, Y3, ya} et nous appliquons 
l’algorithme du simplexe au problème auxiliaire. Ceci donne 


et les itérations correspondent au chemin indiqué dans la figure. Si on avait choisi dans la première 
itération le pivot dans la colonne de x2, on aurait tout de suite trouvé la solution de base admissible 
qui correspond à xı = 0 et 2 = 5. 

La valeur de la fonction objective est zéro (voir le dernier tableau de (5.4)). En supprimant 
la colonne correspondant à 21, on obtient alors une solution de base admissible pour le problème 
original. Il faut encore adapter la fonction objective 


571 — 4x2 = —5(—y3 + 4) — 4(y3 + Ya + 1) = y3 — Ayo — 24 


pour obtenir le tableau de départ cherché. L’algorithme du simplexe donne maintenant la solution 
en une itération: 


IV.6 Exercices 


Chapter V 


Calcul intégral 


L’intégral d’une fonction a été introduit et discuté dans le cours “Analyse I” (semestre d’hiver). Le 
but de ce chapitre est d’exercer le calcul des intégrals et de donner des applications interessantes. 
Nous suivrons de près la présentation des paragraphes II.4 et II.5 du livre “L'analyse au fil de 
l’histoire” de Hairer & Wanner (Springer-Verlag 2000). 


V.1 Primitives 


Newton, Leibniz et Joh. Bernoulli découvrent indépendamment que l’intégration est une opération 
inverse de la différentiation. 

Pour une fonction donnée y = f(x), nous désignons par z = F(x) laire sous f(x) entre a 
et x (figure V.1, gauche). Le point crucial est que la fonction f(x) est la dérivée de F(x). Nous 
appelons alors F(x) une primitive de f(x) et nous la notons par f f(x) dx. ! On a alors 


F@)= f (dr +c <> F'(x) = f(x). 


Pour Leibniz, l’aire en question est la somme (plus tard : “intégrale”) des aires de rectangles 
infinitésimaux (figure V.1, droite). 


a T1 T2 FF Tn =b 
Figure V.1: Idée de Newton (gauche), idée de Leibniz (droite). 


Les primitives ne sont pas uniques : à chaque primitive F(x) peut être ajoutée une constante 
arbitraire C, car F(x) + C est à nouveau une primitive de la même fonction. Pour C = —F (a), 


ILeibniz (1686) introduit le signe intégral, le mot “intégrale” est de Joh. Bernoulli, et fut publié par son frère 
Jac. Bernoulli (1690). La notation (1.1) pour laire entre les bornes a et b est due à Fourier (1822). 
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nous obtenons la primitive F(x) — F(a) qui s’annule en x = a (en même temps que l’aire 2). 
Nous avons donc pour l’aire entre a et b 


Ja = rt - Fa (1.1) 


(nous rappellons que cette identité est le “théorème fondamental du calcul différentiel”, voir le 
cours “Analyse I”). 

Chaque formule de différentiation, inversée, livre une primitive. Par exemple, la dérivée de la 
fonction f(x) = x”! est f'(x) = (n + 1)". Donc, x"*1/(n + 1) est une primitive de x". La 
table suivante inverse de cette manière des formules bienconnues de la différentiation. 


Petit tableau de primitives 


grtt 1 
fru- 1e (n # —1) Jra-me+c 
x 
[eue +C 
| a eF foszar=sne + 


|o dx = arctan x + C dx = arcsin x + C 


f 1 
V1 — zr? 
Pour être utile, une table de primitives doit comporter plusieurs centaines de pages. Mentionnons 


ici celles de Gröbner & Hofreiter (1949) et de Gradshteyn & Ryzhik (1980). Aujourd’hui, de 
nombreux logiciels de calcul symbolique contiennent de telles tables. 


V2 Applications du calcul intégral 


Aires de paraboles. L’aire sous la parabole y = x" de degré n entre a et b se calcule avec (1.1) et 


le tableau précédent : 
b n+l pb bett ER ont 
z a 
n dz = = — 2.1 
i Aa + lle n+1 (n) 


Nous avons utilisé la notation F (x)|? = F(b) — F (a). 


Aire d’un disque. Pour calculer l’aire d’un quart de disque, prenons la fonction f(x) = v1 — x? 
pour 0 < x < 1. Une primitive de f(x) est 


1 
F(x) = 5V1 — x? + J arcsin 7, (2.2) 


comme on peut le vérifier par différentiation. Nous verrons plus tard comment trouver de telles 
formules. Par (1.1), nous avons 


1 
aire du disque unité = af VI- x? dx = afro = F(0)) =r, 
0 


car sin(r/2) = 1. 
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Voici un découpage plus élégant du disque. Rien ne nous oblige à supposer que f(x) dx 
s’obtienne en découpant l’ aire considérée en rectangles verticaux. Découpons le cercle (de rayon a) 
en triangles infiniment minces. L’aire d’un tel triangle est 


a. dọ 
2 


où dọ est l’incrément infinitésimal de l’angle. L’aire totale (la somme 
des aires de tous ces triangles) est 


2r 2 2 p2r 2 
a dg a af |?T 9 
S= — Z — d = — —— 2 
J 2 J A Das 7 0 4 


Volume de la boule. Considérons une boule de rayon a (voir la figure V.2) et découpons- 
la en tranches d’épaisseur dx et de rayon r = Va? —x?. Le volume d’une telle tranche est 
dV = r?x dx = (a? — x°)r dx et le volume total de la boule est 


dS = 


NIA 


dya 


. 


+a 3 3 
x°\|ta 4an 
v= f (a? x?}r de = r (za? -—) = 
- 3 / l-a 3 
<S dx 
bd a — 2° 
r=a 


Figure V.2: Volume d’une boule 


Longueur d’arc. On veut calculer la longueur d’arc L d’une 17 
courbe y(x) donnée, entre x = aet x = b. Si on augmente x de dx dy ds dy 
(voir la figure), ordonnée croît de dy = y'(x) dx (en négligeant p 
les termes d’ordre supérieur). La longueur d’une petite portion de 


d 
la courbe est par conséquent donnée par ds, où i 
ds? = dz? + dy? = (1 + y'(x)}°) dz? à 
-0 l 
0 1 


(théorème de Pythagore). Si on fait tendre dx — 0, on a 


b 
ds = y1 + y'(x)? -dx et r= V1+yi(x) dz. (2.3) 


Exemple. Pour la parabole y = x°, nous avons y' = 2x et la longueur d’arc entre x = O et x = 1 
est donnée par (voir la formule (3.15) plus loin) 


| 1 1 1 5 1 
L= | VIA de = Sa vid +2 m(2 + Va +1) = VŽ 41 m24 V8) 
0 (0) 
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V.3 Techniques d’intégration 


Nous abordons ici des techniques générales permettant de trouver des primitives. Observons tout 
d’abord que l’intégration est une opération linéaire, c.-à-d. 


Jante) +arta) de a f hi) dete f Ra) Ti 8.1) 


puisque la différentiation est une opération linéaire. 
Substitution d’une nouvelle variable. Soit 
F(z) une primitive de f(z), 


i.e. F'(z) = f(z), et considérons la substitution z = g(x) qui transforme la variable z en x. La 
formula pour la différentiation d’une fonction composée donne alors que 


F(g(x)) est une primitive de f(g(x))g'(x). 
Par conséquent, nous avons 
b g(b) 
[rose f 82) 
a gla 


car, par (1.1) chaque membre est égal à F (g(b)) — F(g(a)). Le membre de gauche a été obtenu 
par la substitution z = g(x) en f(z) et avec dz = g'(x)dx. 


2 


1 
mêmes aire 


l 
1 2 1 2 À? 


Figure V.3: Changement de variable dans une intégrale 


1.5 
4 
1 S y 
à LE 


avec la substitution z = x?. Puisque dz = 2x dx, nous obtenons de (3.2) 


L5 9 22% 9 se 
- 2x dx = dz = 2:In(1 
Î 1 + 7x2 étre | 1+z i A 0 


La figure V3 illustre le changement de variable z = x? transformant la fonction 4x/(1 + x°) en 
2/(1 + z). Les points x et x + dx sont tranformés en z = x? et z + dz = x? + 2x dx + dx?. Pour 


Interprétation géométrique. Calculons 


1.5 
=2.In(l+z)) = 2. In(3.25). 
0 
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dx — 0, les rectangles en noir ont les mêmes aires et par conséquent, les deux intégrales de (3.2) 
ont la même valeur. 


Exemples. L'art consiste à trouver de “bonnes” substitutions. Démontrons-le dans une suite 
d’exemples. 

Pour des fonctions de la forme f(ax + b), on pose z = ax + b. Par exemple, avec z = 5x + 2, 
dz = 5 dx, nous avons (en omettant la constante d’intégration) 


dz 1 1 
5z+2 q “ LORS RENE ARE 5g+2 42 
i e £ I e 5 5 e 5€ (3.3) 
Parfois, le facteur g'(x) est facilement reconnaissable pour la substitution z = g(x). Dans 
l'intégrale suivante, par exemple, le facteur x incite à poser z = —x?, dz = —2x dx. On obtient 
alors í i i 
2 2 
== dy === 7 dz = == č = —- e”. 4 
f ze x 7 Î e dz 5 e 5 e (3.4) 


Le tableau du paragraphe V.1 donne les intégrales de 1/(1+x°) ou de 1/V1 — x°. Pour trouver 
la primitive de 1/(7 + x?) ou de 1/7 — x?, on utilise la substitution x? = 72? ou x = 7x, 
dx = V7 dz. Cela donne par exemple, 


Í dx | V7 dz U a ETE (3.5) 
— — = = —= ACTAN 2 = —= AICtAN ——. A 
7+? 7+2) V7 V7 V7 


Les expressions quadratiques x? + 2bx + c sont souvent simplifiées en “complétant le carré” 
x? + 2bx +c = (x + b)? + (c — b’), puis en faisant la substitution z = x + b. Ainsi, l’intégrale 
suivante est réduite, par la substitution z = x + 1/2, à l'intégrale (3.5) : 


/ dx i dz 2 ¿i 2z 2 i E + a 3.6) 
—=—— = | ———— = — arctan — = — arctan . ; 
r? +x+l 22+3/4 v3 V3 v3 V3 

Comme dernier exemple, prenons la fonction (x +2) /(x?°+x+1). Nous écrivons le numérateur 
sous la forme x + 2 = (x + 1/2) + 3/2, pour que la première partie x + 1/2 soit un multiple de 


la dérivée du dénominateur. Cette partie de l’intégrale est ensuite calculée par la substitution 
z = x? + x + 1. La deuxième partie est un multiple de (3.6), et nous avons 


2 1 2 1 
| =e- 5 nà? +a +1) + V3arctan( - J (3.7) 


Intégration par parties. Une deuxième technique d’intégration est basée sur la règle de différen- 
tiation d’un produit de deux fonctions. La formule (uv) = uv + uv! donne par intégration 
u(æ)u(x) = f(u/(x)u(x) + u(x)v'(x)) dx, d’où 


fuera) dx = u(x)v(x) — Jewo dz. (3.8) 


Cette formule ramène le calcul d’une intégrale à celui d’une autre. Si les facteurs u’ et v sont bien 
choisis, cette deuxième intégrale sera plus facile à calculer que la première. 

Exemples. Calculons f x sin x dx. Il ne serait pas judicieux de choisir u’ (x) = x (c.-à-d. u(x) = 
x’ /2) et v(x) = sinz, car la deuxième intégrale serait encore plus difficile. Choïisissons donc 
u'(x) = sin x (donc u(x) = — cos x) et v(x) = x. La formule (3.8) donne alors 


Jasine dr = -zrcose+ f1- coszde = -r cose + sin z (3.9) 
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Il arrive que l’intégration par parties doive être répétée. Dans l’exemple suivant, nous posons 
d’abord v(x) = x°, u’ (x) = e”, puis faisons une deuxième intégration par parties avec v(x) = x, 
u(x) =e": 

[edsa | re de = eg 20 +2) (3.10) 
Des fonctions telles que ln(x), arctan(x) ont des dérivées simples ; on les utilisera souvent pour 
v(x): 
[med= fiomedr-ome- f Zar = 2m2- 1), (3.11) 
x 
J tan x d t T d t a E (3.12) 
arctan x dx = tarctanx — | —— dx = q arctan x — = In 
a EF arcta 3 vali 
la dernière intégrale a été calculée avec la substitution z = 1 + x?, dz = 2x dx. 


Pour calculer l'intégrale f V1 + 4x? dx (rencontrée dans le calcul de la longueur d’arc d’une 
parabole), nous faisons une intégration par parties avec u'(x) = 1, a = y1 + 4r? : 


|r dx = rv 1 + 4r? - | -=> (3.13) 


v1 + ra 


Si nous écrivons le numérateur de la dernière intégrale sous la forme 4z? = (1+4x*)—1, l'intégrale 
se décompose en deux intégrales : l'intégrale cherchée — f V1 + 4x? dx et la deuxième intégrale 
semblable à la dernière du tableau du paragraphe V.1 : la dérivée de arsinh z est 1/ v1 + 2? et la 
substitution z = 2x donne 


1 1 
J- Nes = jasinh (2x) = : = In (2x + v4r? + H: (3.14) 
T 


Ainsi (3.13) livre 


1 1 
1" FA de = Sa VI +4 +2 In (2x NAT 1). (3.15) 


Relations de récurrence. Pour calculer l’intégrale 
dx 
Jis De 3.16 
f FA (3.16) 


intégrons par parties avec u’ (x) = 1 et v(x) = 1/(1+x°)" 


1 z 2x? 
Jn == 1 . —— — n —_—_— 
J CE dx TERI +a f Tape dx 


et, comme en (3.13), écrivons dans la dernière intégrale 27° = 2(1 + x?) — 2 pour obtenir 


z 
Jn = + 2nJn — 2N Jn41- 
(La E Le 
Il semble que notre choix ait été maladroit : au lieu de décroître, l’indice n est devenu plus grand. 
Renversons simplement la formule : 


1 2n— 1 
z n J 


aa .17 
2n Gray? ds A7 CSL 


Jayi z= 


Cette relation ramène le calcul de (3.16) à celui de l'intégrale J, = arctan x. 
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V4 Intégration de fonctions rationnelles 


Soit R(x) = P(x)/Q(x) une fonction rationnelle (P(x) et Q(x) des polynômes). Si on sait 
calculer les zéros de Q(x), nous allons voir qu’on peut toujours trouver une primitive f R(x) dx. 
Elle sera trouvée en trois étapes : 

- réduction au cas deg P < deg Q (où deg P est le degré de P(x)) ; 

— factorisation de Q(x) et décomposition de R(x) en fractions simples ; 

— intégration des fractions simples. 

Réduction au cas degP < deg Q. On effectue une première simplification de la fonction R(x), 
si deg P > deg Q. Dans cette situation, on divise P par Q pour trouver 


P(x) 
QG) 


où S(x) et P(x) sont des polynômes (quotient et reste) avec deg P < deg Q. Prenons pour exemple 


= S(x) + 


(4.1) 


P(x) _ 225 — 3x° — 97° + 23x? + x° — 44r + 39 (4.2) 
Q(z) x5 + xt — 5x’ — x? + 8x — 4 | | 


Tout d’abord, on fait disparaître le terme 2r° en retranchant 2xQ(x) de P(x), puis on additionne 
5Q(x) à P(x) pour obtenir 


P(x) 6x4 — 20x? + 4x + 19 
Sppe LE 
Q(x) T5 + x — 5x3 — q? + 8x — 4 


(4.3) 


Le polynôme S(x) est facilement intégré ; seul le deuxième terme dans (4.1) nécessite des efforts 
supplémentaires. 


Décomposition en fractions simples. Supposons qu’on connaisse les racines de Q(x). Notons 
les racines réelles distinctes par 71, . . . , Yk et les racines complexes conjuguées distinctes par &ı + 
iĝı,..., Q1 iĝ, (qui apparaissent en paires, si le polynôme Q(x) possède des coefficients réelles). 
Dans ce cas, nous obtenons la factorisation en polynômes réels 


2 i 
Q(x) = J[e-7" IX ((x — a)? + 82), (4.4) 
où les m; et n; sont les multiplicités des racines. Le lemme suivant montre comment une fonction 


rationnelle peut être décomposée en somme de fractions simples. 


Lemme 4.1 Soit Q(x) donné par (4.4) et P(x) un polynôme à coefficients réels avec deg P < 
deg Q. Alors il existe des constantes réelles A;j, Bij et Ci; telles que 


P(x) eni = 7e -+ 


Démonstration. Nous traitons les facteurs de Q(x) l’un après l’autre. Commenọns par les racines 
réelles et, pour cela, nous posons Q(x) = (x — y)”q(x), où y est une racine de Q(x) et q(y) # 0. 
Démontrons maintenant l’existence d’une constante C et d’un polynôme p(x) de degré < deg Q—1 
tels que 


=a e aN (4.6) 
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c’est-à-dire, après multiplication par le dénominateur commun, 
P(x) = C:q(x) +p(x): (£ —7). (4.7) 


En posant x = y, on voit que C = P(y)/q(y). Pour obtenir le polynôme p(x), nous divisons 
P(x) — C - q(x) par (x — y). Appliquons ensuite récursivement le même procédé au second terme 
du membre de droite de (4.6). Nous parvenons alors à la première partie de la décomposition (4.5) 
annoncée. 

Quant aux racines complexes, nous écrivons Q(x) = ((x — a)? + 82)" q(x), où a + if est une 
racine de Q(x) et g(a + iĝ) Z 0. Alors il existe des constantes réelles A, B et un polynôme p(x) 
de degré < deg Q — 2 tels que 


P(x) z A+ Br p(z) 
(a) kp ae) a +8)" esa e ae 
Pour le voir, nous prouvons l’équation équivalente 
P(x) = (A+ Bz) :q(x) + p(z) : ((x — a) + 8°). 
En posant x = a + iĝ, nous déterminons A et B en comparant les parties réelles et imaginaires. 
Le polynôme p(x) est alors obtenu en divisant P(x) — (A + Bz) - q(x) par ((x — a)? + 8°). Nous 
parvenons donc à la formule (4.5) par récurrence sur le degré de Q(x). m 


Exemple. Le polynôme Q(x) de (4.2) admet la factorisation 


Q(x) = 2° + zt — 5r? — 2° + 8x — 4 = (x — 1)’ (£ + 2). (4.8) 


On applique (4.7) en posant y = —2 et n = 2, et (4.6) livre 


6xt — 20x? + 4x 4 19 — —1 4 6 — 11e —æ +9 
{œ—1){r+2) (x+2}ÿ (x — 1)$(x +2) 
Deuxième étape : posons y = —2 et n = 1 et nous avons 
6x* — 20x? + 4x + 19 -1 3 3x? — 8x + 6 
c = c t lM IMO. (4.9) 
(x — 1)*(x +2}? (EP x+2 (x — 1) 


Dans la dernière expression, nous écrivons x = (x — 1) + 1 pour que 34° — 8x + 6 = 3(x — 1)? — 
2(x — 1) + 1, et (4.9) devient enfin 


6x — 202? +4r +19 1 ge e A pa a (4.10) 
(z—-1)}(z+2)} — (z—1}} (æ—-1)Ÿ x-1 (xc+2) zxz+2 | 
Deuxième possibilité. Par le lemme 4.1, nous pouvons écrire 
Gxt — 20x? + 4x + 19 A A A B B 
Et RE (4.11) 
(x — 1)%(x +2)? (x—1)} (x-1? x-1 (x+2} x+2 


On calcule les coefficients A; en multipliant (4.11) par (x — 1)° : 


Gx* — 20x? + 4x + 19 


a2 = Ao + Aix — 1) + A(z — 1} + (x — 1)*g(x), 
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où g(x) est une fonction bien définie au voisinage de x = 1. Les A; sont donc les premiers 
coefficients de la série de Taylor de P(x)/(x + 2)°, donnés par 


, 


o1 d (= 201? + 4x 4 =) 


t dr 


(x + 2)? x=1 
i.e. Ao = 1, A = —2, A = 3. De manière analogue, nous obtenons 
_ 1 d (= 20x? + 4x 4 =) 
il dr (x — 1}° z=2 


ie. Bo = —1, Bi = 3. 
Intégration de fractions simples. Dans la troisième étape, les termes de la première somme dans 
(4.5) sont intégrés en utilisant les formules du paragraphe V.1 (cf. le petit tableau) : 
d = si j>l 
“a cc NN J 
o = =g (4.12) 
ln(x — 7) si j= 1. 


Pour l’exemple (4.2), nous avons avec (4.3), (4.8) et (4.10), 


P(x) , 3 1 2 1 
Jess 5x Gent a Less SEAT 


Si toutes les racines de Q(x) sont réelles, nous avons alors trouvé une primitive de P(x)/Q(x). 
Pour intégrer un terme général de la deuxième expression du membre de droite dans l’équation 
(4.5), nous l’écrivons sous la forme 
A + Br = B(z-—a) $ A+ Ba 
(Gaas esae ear 
Le premier terme de cette expression est intégré en faisant la substitution z = (x — a)? + 8’, 


dz = 2(x — a)dx. Pour le deuxième terme, nous utilisons la substitution z = (x — a)/B et 
obtenons l’intégrale (3.16) du paragraphe V.3. Ainsi, nous avons pour j = 1 


le: dz = 2 In((x — a)? + 8°) + 2 n arctan(—— ), 


r-a} +8? 2 
et pour j > 1 
Î Aar e ` Too (ES), 
(Ga) IIIN =a RE B57 b 
où Jı (z) = arctan z et par (3.17) 
2 — 1 
CR 0) (4.13) 


Jery g 
Exemple. Le lemme 4.1 donne la décomposition suivante pour la fonction (1 +4): 


1 1 A+ Br C + Dr 


1 + x (x? + V2x + 1)(x2 Vax+1) 2+V2r+1 22 — Dr +1 
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Multiplions cette relation par (x? + V2x + 1) et posons x = (—1  i)/ v2. Cela donne 


1 li -li 
"= ai À + pen 
D 4 V2 
et A = 1/2, B = 2/4 apparaissent en comparant les parties réelles et imaginaires des deux 
membres. Les constantes C = 1/2 et D = — 2 /4 s` obtiennent de manière analogue. Ces calculs 


livrent finalement le résultat 


de v2, 2 +V2r+1 V2 
f 1 F TE = g In EN EE + “4. (arctan(r 2 + 1) + arctan(x J= 1)). (4.14) 


Remarque. La décomposition en fractions simples fut un des stimulants au réveil de l’intérêt des 
mathématiciens du XVIII siècle pour les racines des polynômes et pour l’algèbre. 


V.5 Substitutions importantes 


Le résultat précédent va nous permettre, grâce à diverses substitutions, de trouver la primitive pour 
d’autres classes de fonctions. Dans tout ce qui suit, R représente une fonction rationnelle à une, 
deux ou trois arguments. 


Intégrales de la forme fR( Vax + b,x)dx. Voici une substitution évidente : 


Var +b = u, pai >i dx = 


a 


ut"! . du, (5.1) 


alza 


elle donne 


n 


fr(rar ts) dx = T [r(u* — 


Parm du = HO du, 


où R(u) est une fonction rationnelle. On peut donc calculer cette dernière intégrale par les tech- 
niques développées ci-dessus. 


Intégrales de la forme fR(e**)dx. Il est évident de poser ici u = eò®™ avec du = Àe “dx et 
dx = du/(Au). La fonction à intégrer qui en résulte est une fonction rationnelle. 


Exemple, 


f dx I dx a) du a 
2+sinhz 2+ (e® — e=) /2 u2+du—1 
du 1, u+2—-V5 1. +245 
2 In 
PEF 


u+2} -5 5 


mE ——, — n 5 
E2FVS, Vi FIFS 


Intégrales de la forme fR(sin x, cos x, tan r)dx. Une des plus célèbres découvertes de l’ Antiquité 
grecque (Pythagore 570-501 av. J.-C., voir aussi R.C. Buck 1980, Sherlock Holmes in Babylon, 
Am. Math. Monthly vol. 87, Nr. 5, p. 335-345) sont les triplets (3, 4, 5), (5, 12, 13), (7, 24, 25), ..., 
qui satisfont a?+b° = c? et sont de la forme (u, (u? —1)/2, (u? +1)/2) ; cela suggère la substitution 


2u 1- u? 2u 


cosg = tan t = — (5.2) 


Em yE 1+u2° 1— u? 
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On vérifie que sing = u(1 + cosx) ; par conséquent le point 
(cos x, sin x) est l'intersection de la droite n = u(1 + £) et du 
cercle unité (voir la figure). Donc u = tan(x/2), x = 2 arctanu, 
et 

2 


dx = 
à 1 +u? 


du. 


Cette substitution transforme f R(sin zv, cos z, tan x)dx en inté- 
grale d’une fonction rationnelle. 


| dx 2du =} du 
2+sing (+u)(2+ 2) uputi’ 


La dernière intégrale nous est déjà connue (4.18) ; par conséquent, 


Exemple. 


Jz = Na srctan( (u+ D = Na arctan (= (tan zu D). 


Intégrales de la forme fR(Vax? + 2bx + c,x)dx. L'idée (Euler 1768, § 88) est de définir une 
nouvelle variable z par la relation ax? + 2bx + c = a(x — z)°. Cela donne la substitution 


a —C alaz? + 2bz + c) 
D dx = Re 
2(b + az) 2(b + az)? 
2 
Heure Vo) he 2e € 


2(b + az) 
Var? + 2bx +c 
E ———-, 
ya 
et il s’agit à nouveau de calculer l'intégrale d’une fonction rationnelle. 


Parfois, il est plus simple de transformer l’expression vaz? + 2bx + c par une substitution 
linéaire z = ax + 6, en une des formes 


vz? +1, vz? —1, VI — 272. 


(5.3) 


Puis, les substitutions 
z =sinhu, z = cosh u, z=sinuųu (5.4) 


permettent d’éliminer les racines carrées de l’intégrale. 


Exemple. Considérons, une fois de plus, l'intégrale (3.15). En posant x = sinh u, nous obtenons 


1 h inh 
JET a = forua- [G2 aut 2 


2 2 2 4 
u sinhucoshu 1 zyr? +1 
on G 


Remarquons, que la fonction inverse de x = sinh u est obtenue en posant v = e” dans la définition 
de sinh u et en calculant les racines du polynôme v? — 2xv — 1 = 0 ce qui est équivant à 2x = 


v—v 


V.6 Exercices 


Chapter VI 


Equations différentielles ordinaires 


Une équation différentielle ordinaire est une équation de la forme 


y = f(x,y) ‘où y”"=f(z,y,y) où 


Il s’agit donc de trouver une fonction y(x) telle que y'(x) = f(x, y(x)) ou y” (x) = f(x, x(x), y'(x)) 
pour tout x dans un certain intervalle. 

Dans ce chapitre nous commençons par le cas où y(x) est une fonction scalaire. Nous traitons 
quelques exemples historiques, et des problèmes qu’on peut résoudre analytiquement. (Cette partie 
suit de près la présentation des paragraphes II.7 et II.8 du livre “L'analyse au fil de l’histoire” de 
Hairer & Wanner.) Ensuite nous considérons la situation où y(x) est une fonction vectorielle 
(y : R — R”) et nous étudions l’ existence et l’unicité des solutions. 


VI.1 Exemples historiques 


Un excellent article sur l’origine des équations différentielles est écrit par G. Wanner!. Nous en 
prenons deux exemples. 


VI.1.1 La tractrice 


Lors du séjour de Leibniz à Paris (1672-1676) durant lequel il suit des 
cours d’Huygens, Claude Perrault, célèbre anatomiste et architecte, lui 
pose le problème suivant : quelle est la courbe qui a la propriété qu’en 
chacun de ses points P le segment de la tangente entre P et laxe x est de 
longueur constante a ? Pour concrétiser cette question, Perrault tire de son 
gousset une “horologio portabili suae thecae argenteae” et la fait glisser sur la table. Il précise 
qu'aucun mathématicien parisien ni toulousain (Fermat) n’a été capable de trouver l’équation de 
la courbe. 
Leibniz publie sa solution en 1693 en affirmant la connaître depuis longtemps : puisque 


d F 
-E i VTT Y y = dr, (1.1) 


= Fri ee 3 


on trouve la solution par quadratures. Leibniz affirme que c’est un “fait bien connu” que cette aire 
peut être exprimée à l’aide d’un logarithme, ce qui se vérifie avec la substitution 4/a? — y? = v, 


1G. Wanner, Les équations différentielles ont 350 ans, L’ Enseignement Mathématique 34 (1988), 365-385. 
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a? — y? = v?, —y dy = v dv, qui mène à 


+02 - [ae fe fe 


a— v a+ vu 


I 
| 
e 
| 
| 
oje 


a a—v a— a — y? 
lo AE y = à log VE ET. 
y 
Si l’on veut que y = a pour x = 0, la constante d’intégartion s’annule. 


VI.1.2 La caténaire 


Galilée (1638) affirme que la forme d’une chaîne suspendue entre deux clous est presque une 
parabole. Environ 20 ans plus tard, un jeune Hollandais âgé de 16 ans (Christiaan Huygens) 
démontre l’impossibilité de ce résultat. Enfin, la solution du problème de la forme d’une corde 
flexible suspendue (“Linea Catenaria vel Funicularis”) par Leibniz (1691) et Joh. Bernoulli (1691) 


fut un succès considérable pour le calcul différentiel. 
ç ç. L. De Linca Catenaria A 


AC seu ORSÅR ut Mumert; BC ut Legarithmi 
PA ORARAT i ORAR M) EA 


etre + CA (ge 
2 De CC ANEA 


sg 
ER Ams a oncer 


Figure VI.1: La caténaire (gauche) et un dessin de Leibniz de 1691 (droite) 


Pour un point P de la courbe, considérons la force horizontale H et la force verticale V (fig- 
ure VI.1). Nous avons alors que 
H = à, V=qs 
(où a et q sont des constantes et s est la longeur d’arc AP) parce qu’il n’y a pas de force horizontale 
extérieure et V représente la pesanteur de la partie AP de la chaîne. En notant la pente en P par 


p = y', nous obtenons 
_dy V qs 


2S a 
Après différentiation, nous avons avec c = a/q 


c- dp = ds = y1 + p dx, (1.2) 


une équation différentielle pour les variables p et x. En utilisant la substitution p = sinh u, une 
intégration donne? 


gz — to =c | ——— =c | du=c.-u. 
/1+7p°? 


Par conséquent, 


p = sinh(—") et v = K + c- cosh ( 1—2), (1.3) 


Rappelons que sinh u = (e“ —e-")/2, cosh u = (e” +e-")/2, cosh? u — sinh? u = 1, la dérivée de sinh u est 
cosh u et la dérivée de cosh u est sinh u. 
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VI.2 Quelques types d’équations intégrables 


Discutons maintenant de quelques types simples d’ équations différentielles qui peuvent être résolues 
par des calculs d’intégrales (“par quadrature”). 


VI.2.1 Équations à variables séparées 


Tous les exemples précédents, à savoir (1.1) et (1.2), sont du type 


y'= J(x)g(y). (2.1) 
On les résout en écrivant y = dy/dx, en “séparant les variables” et en intégrant, i.e. 
dy dy 
—— = f(x) dx et JE fre dx + C. (2.2) 
gly) G) gly) @) 


Si G(y) et F(x) sont des primitives de 1/g(y) et de f(x) respectivement, la solution est exprimée 
par G{y) = F(x) +C. 


Exemple 2.1 La loi logistique (Verhulst 1837), décrivant la croissance d’une population, est donné 
par l’équation différentielle | à 
y = ay — by 

où a et b sont des constantes positives (ÿ représente la dérivée par rapport au temps; nous écrivons 
t au lieu de x). Supposons que a = b = 1. En séparant les variables et en utilisant 


dy dy dy 


yl-y) y 1-y | 


on trouve la solution sous la forme (avec la constante 1 
déterminé par y(0) = yo) 2 e 
0 i l i 


t 
nf) =t+C resp  y(t) _ Éd ne 


_ 1+ Cet 


VI.2.2 Équations linéaires homogènes 
Un cas particulier important de (2.1) est 
y = f(x). (2.3) 


Sa solution est donnée par 


my= | fæ)dr+0 ou y=C-exp( | f)ar); (2.4) 


VI.2.3 Équations linéaires inhomogènes 


Elle est de la forme ou 2.5) 
et le terme g(x) est l’inhomogénéité de l’équation différentielle. Le procédé de résolution s’appelle 
variation des constantes. L'idée est de prendre la solution (2.4) de l’équation homogène avec C 
remplaçée par une fonction c(x) et de déterminer c(x) afin de satisfaire (2.5). On pose 


y(x) = c(x) - u(x) où u(x) = exp d FA dt). (2.6) 
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cu (x) = c(xju(x) + c(x)f(x)u(x) et on compare 


on calcule sa dérivée y'(x) = c'(x)u(x) + 
= g(x) et une simple intégration donne 


avec (2.5). Ceci implique c’(x)u(x) 


ylz) = C'-u(x) +u(x) Î m dt. (2.7) 


Cette relation montre que la solution de (2.5) est la somme de la solution générale de l'équation 
homogène et d’une solution particulière de l'équation inhomogène. 


VI.2.4 Équations différentielles d’ordre 2 


Une équation différentielle d’ordre 2 est de la forme 


y” = f(x,y, y’). 


La résolution analytique d’une telle équation est rarement possible. Il y a pourtant quelques ex- 
ceptions. 


Équations ne dépendant pas de y. Il est naturel de poser p = y! pour que l’équation différentielle 
y” = f(x, y’) devienne l'équation du premier ordre p' = f(x, p). Remarquons que l’équation (1.2) 
de la caténaire appartient à ce type. 


Équations ne dépendant pas de x. Tl s’agit d’une équation différentielle de la forme 


y" = f(y, y"). (2.8) 


L’idée est de considérer y comme variable indépendante et de chercher une fonction p(y) telle que 
y’ = p(y). La règle de la dérivation d’une fonction composée donne 


n_dp _dp dy, 
= d£ dy da ? h 


et la formule (2.8) devient une équation du premier ordre 
pa p= Jup): (2.9) 
Une fois la solution p(y) de (2.9) trouvée, il reste à intégrer y’ = p(y), une équation de type (2.1). 


Exemple 2.2 (pendule mathématique) Le mouvement d’un Z 
pendule est décrit par l’équation (avec m = £ = g = 1) 


y +siny=0 no 
(y désigne l’écart par rapport à la position d’équilibre). Comme 


cette formule ne dépend pas de t (nous écrivons de nouveau t 
au lieu de x), nous pouvons utiliser la transformation ci-dessus 


pour obtenir à 
p: dp = -siny : dy et À = cosy +C. 
Si l’on dénote l’amplitude des oscillations par A (le cas où p = y’ = 0), on obtient C = — cos À 


et par conséquent 


P — 


À 2 roy 200 À (2.10) 
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qui est à nouveau une équation différentielle pour y. La séparation des variables donne enfin la 
solution exprimée sous forme implicite à l’aide d’une intégrale elliptique 


I = (2.11) 
o V20C0s7 — 2 cos À 
(la constante d’intégration est déterminée par la condition y = 0 pour t = 0). 

Même s’il n’est pas possible d’exprimer l’ intégrale de (2.11) en termes de fonctions élémentaires, 
cette représentation est très utile. Par exemple, si T est la période des oscillations, la déviation 
maximale À est atteinte pour t = 7/4. Donc, la période est donnée par (rappelons que 1 — cos y = 
2sin°(y/2)) 


A A 
Pa | is Í soo Hooo (2.12) 
o vZcosy — 2cos À o y'sin?(A/2) — sin?(y/2) 


Avec l’abréviation € := sin(A/2) et en utilisant la substitution sin(y/2) = £ sin a, on obtient 


"2 da —1/2 i A? 1144 
TEA] ——=14 =D f in™ ada = 2r(1+— Te 
1 V1 —e?sin° a >| k Ji i 0 Los r( 71673072 ) 


k>0 


Nous voyons que la période T dépend de l’amplitude À ; elle est proche de 27 si A est petit. 


VI3 Équations différentielles linéaires 
Soient ao(x), a(x).....a,_1(x) des fonctions données. On appelle 
y™ Laney D +... + a(x)y + ao(x)y = 0 (3.1) 
une équation différentielle linéaire homogène d’ordre n et 
y™ + an (ny) +... + a(x)Y + ao(x)y = f(x) (3.2) 


une équation différentielle linéaire inhomogène (si f(x) + 0). Pour le membre de gauche de ces 
équations, introduisons le symbole 


L(y) := y™ +an_1(r)y D +... + ao(x)y. (3.3) 
Les équations (3.1) et (3.2) s’écrivent alors 
£L(y)=0 respectivement L(y)= f. (3.4) 


L'opérateur différentiel L opère sur des fonctions y(x) et le résultat L(y) est de nouveau une 
fonction, donnée par (3.3). Il a une propriété importante, la linéarité, 1.e. 


L(ciy1 + c2y2) = aL(y) + cL(y). (3.5) 


Le résultat suivant est une conséquence immédiate de cette linéarité. 


Lemme 3.1 Soient y(x), y(x),...,y(x) n solutions de l’équation homogène (3.1). Alors, pour 
des constantes arbitraires c1,...,c,, la fonction 
C1ÿ1(x) + cayo(t) +... + Cnÿn(z) (3.6) 


est aussi une solution de cette équation. m 
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Remarque. La solution d’une équation d’ordre 1 comporte une constante (voir le paragraphe VI.2) ; 
la solution d’une équation d’ordre 2 comporte deux constantes arbitraires (voir par exemple la 
formule (1.3)). Par analogie, on peut supposer (Euler) que la solution d’une équation d’ordre 
n comporte n constantes et que (3.6) est la solution générale de (3.1) (si y1(x)....,7,(x) sont 
linéairement indépendantes). 


Lemme 3.2 Nous avons que 


solution générale de : solution générale de solution particulière de 
l’équat. inhomogène (3.2) [ | l’équat. homogène (3.1) l’équat. inhomogène (3.2) 


Démonstration. Soit y une solution particulière de (3.2), i.e. L(y) = f. Pour une solution arbi- 
traire y de (3.1) (i.e. L(y) = 0), nous avons L(y + J) = f par (3.5) et y + Ẹ est une solution de 
(3.2). 

D'autre part, si ÿ est une autre solution de (3.2) (i.e. £(ÿ) = f) alors, de nouveau par (3.5), 
nous avons L(ÿ — ÿ) = 0 et F = y + (F — J) est la somme de Y et d’une solution de l’équation 
homogène (3.1). m 


Conclusion. I] faut trouver, pour résoudre entièrement les équations (3.1) et (3.2) : 
e n solutions linéairement indépendantes de (3.1), 
e une solution de (3.2). 


VI.3.1 Équations homogènes à coefficients constants 


La résolution complète de l’équation (3.1) en formules analytiques est rarement possible. Il y 
a pourtant des exceptions, dont la plus importante se présente lorsque les coefficients a;(x) ne 
dépendent pas de x, i.e. 


y + an 19 D +... + ay + ay = 0. (3.7) 
L'idée essentielle pour la résolution de (3.7) consiste à rechercher des solutions de la forme 
y(x) = e, (3.8) 
où À est une constante à déterminer. En insérant les dérivées 
y'(x) = Xe, JR) = Ve", yP) = Mer 
dans l’équation (3.7), on obtient 
(AP Han XL +... + AÀ + ae = 0. (3.9) 


La fonction (3.8) est donc une solution de (3.7), si et seulement si À est une solution de l’ équation 
caractéristique 


x(à)=0,  x(A) := À + anA! +... + aÀ + a0. (3.10) 


Racines distinctes. Si l équation (3.10) admet n racines distinctes À1,..., Ap, alors eò”, ... , eò? 


sont n solutions linéairement indépendantes de (3.7). La solution générale est alors donnée par 


y(x) = GeT H CALE PRE ne. (3.11) 


On dit que les fonctions y1 (x), .. . , yn (x) sont linéairement indépendantes si la combinaison linéaire (3.6) est 
identiquement nulle seulement si tous les c; sont nuls. Par exemple, 1, x, x?, x3 sont des fonctions linéairement 


indépendantes. 
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Racines multiples. Examinons pour commencer le cas simple de l’équation différentielle 
y™ = 0, (3.12) 
dont l’équation caractéristique À” = 0 possède une racine, de multiplicité n. La solution générale 


de (3.12) est manifestement cı + cox + c32? +... + c,x"" 1, un polynôme de degré n — 1. 
Etudions ensuite l’équation 


y” — 3ay" + 3@°y' — a°y = 0, (3.13) 


dont l’équation caractéristique (A — a)’ = 0 possède la racine a de multiplicité 3. Nous pouvons 
alors introduire une nouvelle fonction u(x) en écrivant 


ylz) = e® . u(x). (3.14) 

Si nous dérivons u(x) = e7% . y(x) trois fois, nous obtenons pour u(x) l équation u” = 0. La 
solution générale de (3.13) est donc donnée par 

y(r) = €. (ci + cor + caz’). (3.15) 


Pour le cas général on a le résultat suivant. 
Théorème 3.3 Si le polynôme caractéristique (3.10) se factorise sous la forme 
RAI == ANG AA EAP 
(avec des x, distincts), alors la solution générale de (3.7) est donnée par 
gx) = pile) + po(x)e nt +... + ple), (3.16) 


où les p;(x) sont des polynômes arbitraires de degré m; — 1 (cette solution contient exactement 
D, m; = n constantes libres). 


Démonstration. Nous illustrons la démonstration dans le cas de deux racines multiples x(À) = 
(À — a) (À — b)’. L’équation différentielle peut être écrite sous la forme 


(y" — 3ay" + 3a°y'— ay)" — 2b(y" — 3ay"+ 3a?y — y) + by" — 3ay" + 3a?y — ay) = 0. 
Chaque solution de (3.13) est donc aussi solution de cette équation différentielle. Écrit sous la 
forme 

(y"— 2by'+ by)" — 3a(y"— 2by + by)" + 3a°(y"— 2by + y) — aè (y"— 2by'+ by) = 0, 
on voit que e*(d; + d2x) est également une solution. L’affirmation est donc une conséquence de 
la linéarité. o 


Éviter l’arithmétique complexe. Le résultat du théorème 3.3 est également valable pour des 
À; complexes. Cependant, si les coefficients a; de l’équation (3.7) sont réels, nous cherchons 
avant tout à obtenir des solutions réelles. Le fait que les racines complexes des polynômes réels 
apparaissent par paires conjuguées nous permet de simplifier (3.16). Soient À, = a + if et À2 = 
a — i5 deux racines complexes conjuguées. Les termes de la solution (3.16) qui correspondent à 
ces racines sont alors donnés par un polynôme multiplié par 


e (qe + ee Pr), (3.17) 
Avec la formule d’Euler etf” = cos Bx + isin Bx, cette expression s’écrit 
e%(d1 cos Bx + da sin Bx) = Ce (sin p cos Bx + cos ysin Bx) = Ce™ sin(bx +4), 


où dı = C1 + © et do = i(cı — c2) sont de nouvelles constantes. En utilisant də + idı = Ce? = 
C cos y + iC sin y, l'expression devient encore plus simple. Voir la figure VI.2 pour un dessin de 
cette solution. 
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a > 0 


Figure VI.2: Oscillations stable et instable 


VL3.2 Équations linéaires inhomogènes 
Le problème consiste à trouver une solution particulière de L(y) = f, i.e. de 

y™® + anay"? +... + ay + ay = f(x). (3.18) 
Le résultat suivant est une conséquence immédiate de la linéarité de (3.5). 


Lemme 3.4 (Principe de superposition) Si y1(x) et y2(x) sont des solutions de L(yı) = fı et 
L(y2) = fo, alors ay1(x) + c2y2(x) est une solution de L(y) = ci f1 + caf. m 


Il y a deux approches pour déterminer une solution particulière de (3.18): 


e La méthode de la variation des constantes. On a vu cette technique pour des équations 
de premier ordre (paragraphe VI.2.3) et nous allons la voir pour des systèmes d’équations 
différentielles linéaires dans le paragraphe VI.6. 


e La méthode rapide. Elle est très efficace, mais elle est applicable seulement si le second 
membre f(x) dans (3.18) est une somme de termes simples. Par le lemme 3.4 ces termes 
peuvent être traités séparément. 


La méthode rapide. C’est une approche qui est possible si f(x) est une combinaison linéaire de 


xi, e%%, e% sin(wrx),... , plus précisément si f(x) est elle-même solution d’une équation linéaire 
homogène à coefficients constants. On essaie de trouver une solution avec la même structure. 


Exemple 3.5 Considérons le cas où f(x) est un polynôme de degré 2, par exemple 
y” + 5y" +2y' +y = 227 + x. (3.19) 
Cherchons une solution de la forme 
y(x) = a + bx + cz’. (3.20) 


En insérant les dérivées de (3.20) dans (3.19), il vient 


ca? + (b + Ac)x + (a + 2b + 10c) = 27° + x. 


En comparant les coefficients des mêmes puissances de x, on a c = 2, b = —7 et a = —6. Une 
solution particulière de (3.19) est donc 


y(x) = 22° — 7x — 6. 
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Exemple 3.6 Supposons que f(x) soit une fonction sinus, 
y" — y + y =sin2r. (3.21) 
Il ne suffit pas de prendre y(x) = a : sin 2x, puisque y’ contient cos 2x. Posons donc 
y(x) = a - sin 2x + b- cos 2x, (3.22) 
calculons les dérivées et insérons-les dans (3.21). Nous obtenons la condition 
(a + 2b — 4a) sin 2x + (b — 2a — 4b) cos 2x = sin 2x. 


Nous en déduisons le système linéaire —3a+2b = 1, —2a—3b = 0, dont la solution est a = —3/13, 
b = 2/13. Par conséquent, une solution particulière de (3.21) est 


y(x) = -* sin 2x + z cos 2x. (3.23) 


Une autre possibilité pour résoudre (3.21) consiste à considérer l’ équation 
y'= y +y = e" (3.24) 


et à en chercher une solution de la forme y(x) = Ae?“*. En insérant les dérivées de Ae?* dans 
(3.24), nous obtenons —4A — 2i A + A = 1 et A = (—3 + 2i) /13. Une solution de (3.24) est donc 


Z3 +2i 2is 
y(x) = - Le (3.25) 


Comme (3.21) est la partie imaginaire de (3.24), nous obtenons la solution de (3.21) en prenant la 
partie imaginaire de (3.25). 


Justification de cette approche. Par hypothèse, f(x) satisfait L1(f) = 0, où £; est un opérateur 
différentiel à coefficients constants. En appliquant cet opérateur à l’équation (3.18), i.e. à L(y) = 
f, nous obtenons (£1£)(y) = 0, et la solution de (3.18) est une solution de l’équation différentielle 
linéaire homogène (£L1£)(y) = 0. La solution générale de cette équation est donnée par le 
théorème 3.3. 


Cas de résonance. Considérons par exemple l’équation 
y" +y=sinx. (3.26) 


Il ne suffit pas de poser ici y(x) = a sin x +b cos x, car cette fonction est une solution de l'équation 
homogène. La justification ci-dessus (voir aussi figure VI.3) nous suggère de tenter 


y(x) = ax sin x + bz cos x. (3.27) 


w= l; 


100} 


Figure VI.3: Solution de y” + y = sinwgz, y(0)= 0, y'(0) = 1, w = 1.09, 1.03, 1.015, 1. 
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La méthode usuelle (insérer les dérivées de (3.27) dans (3.26)) livre 2a cos x — 2bsin x = sin x, et 
donc a = 0 et b = —1/2. Ainsi, une solution particulière de (3.26) est donnée par 


y(x) = 5 cos. (3.28) 


Elle explose pour x — œ (cf. figure VI.3). 


VI4 Systèmes d’équations différentielles — exemples 


Dans les premiers paragraphes, nous avons considéré des équations différentielles pour une fonc- 
tion scalaire. A partir de maintenant nous étudions des problèmes 


y = f(x,y) (4.1) 


où f : R x R” — R”. On cherche une fonction vectorielle y : Z — R” définie sur un intervalle 7 
et satisfaisant y/(x) = f(x, y(x)) pour tout x € T. 
Remarquons qu’une équation différentielle d’ordre supérieur, par exemple 


M — g(æ, z, z, 2"), 
peut être transformée en un système (4.1) d’ordre un. En posant y; = zZ, y = Z’ et y3 = z”, on 


obtient , 


Yı Y2 
Y2 = Y3 
Y3 g(x, Y1, Y2, Y3) 


qui est sous la forme souhaitée. 


VI.4.1 Le problème de Lotka-Volterra 


Commençons par un problème de la biologie mathématique. Le développement de deux popu- 
lations (par exemple, y1(t) pour le nombre de lynx et y2(t) pour le nombre de lièvres) peut être 
modélisé par les équations de Lotka-Volterra 


yi = yi(ay2 — b), Yz = ya(y — ôyı), (4.2) 


où a, 6, y, ô sont des constantes positives. Ceci implique que la population y, croît si yz est plus 
grand qu’une certaine valeur de seuil (6/a) alors que sinon elle décroît. Pour l’autre population, 
c’est le contraire. 


Yo | 4 champ de vecteurs Yo | invariants 


Figure VI.4: Champ de vecteurs (gauche) et invariants (droite) pour le problème (4.2) de Lotka- 
Volterra avec a = 8 = ô = 1 et y = 2. 
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Cette équation différentielle est sous la forme y’ = f (y) où f : R? — R°. Elle est représentée 
graphiquement dans la figure VI.4 (dessin de gauche). Pour un point y = (y1,y2)", le vecteur f(y) 
est dessiné comme une flèche attachée au point y. L’équation différentielle exprime le fait que la 
solution est obligée de suivre ces flèches. 

On voit sur la figure VI.4 que la solution du système (4.2) traverse trois étapes: (1) si la popula- 
tion de lynx est petite, celle des lièvres croît; (2) dès qu’il y a suffisamment de lièvres, la population 
de lynx croît entraînant une diminution de celle des lièvres; (3) la population des lynx décroît à 
cause du manque de lièvres. Ces trois étapes se répètent cycliquement. 


Invariant du problème de Lotka-Volterra. Pour étudier les solutions, divisons les deux équa- 
tions de (4.2) et considérons y, comme fonction de y: (ou y: comme fonction de y1). On obtient 
ainsi (par séparation de variables) 


d — — ô — 
du _n(au—6) ua EZS E (ayz — b) is 
dy2 yaly — Ou) yı Y2 
Une intégration de la dernière équation donne 
y ny — ô yı = ay — 8 MN y2 + Const. (4.3) 


Dans la figure VI.4 (droite) sont dessinées des courbes de niveau de la fonction (4.3). Chaque 
solution (y1(t), y2(t))É reste sur une courbe de niveau pour tout £ € R. Ceci suggère que les 
solutions de (4.2) sont exactement périodiques. 


VI.4.2 Le problème de Kepler 


Une des plus grandes découvertes de l’histoire de la science, due 
à J. Kepler (1609) et basée sur des mesures précises de positions 
de la planète mars faites par lui-même et par Tycho Brahe, est que 
les orbites des planètes sont elliptiques avec le soleil dans un des 
foyers (première loi de Kepler): 


= ————, 
l+ecoso 


(dans le dessin, a = le grand axe, e = l’excentricité, b = av 1 — e?, d = bv 1 — e = a(1 — e?)). 
La deuxième loi de Kepler (r° = Const) dit que le segment qui joint une planète au soleil balaie 
des aires égales en des intervalles de temps égaux. 

Newton (Principia 1687) a réussi à expliquer ce mouvement des planètes par sa loi de gravité 
(force est proportionelle à 1/r?) et par la relation entre forces et acceleration (la “Lex IT” de la 
Principia). Si l’on choisit le soleil comme centre du système des coordonnées, la planète restera 
dans un plan et nous pouvons décrire sa position par deux coordonnées (q1, q2). Avec des normal- 
isations convenables, ceci donne le système d’équations différentielles d’ordre deux 

qı q2 


rs | nn l 4.4 
g (BHEE P (È + 2) =Y 


On peut introduire des vitesses ; ; 
q(t) vitesse 


® soleil 


v= di v2 = Go ravile q(t) position 


pour obtenir un système d’ordre un. 
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Invariants du problème de Kepler. Cette équation différentielle possède plusieurs invariants 
qui permettent une solution analytique. On vérifie par différentiation que les expressions 


1 


Lo +2) — z a (énergie totale) 
Vai ta 
qiv2 — Qui = Lo (moment cinétique) 


Vo 1 qı A10 ) : 
Lo — —— = vecteur de Runge-Lenz-Pauli) 
z) ° Jerg (a) é i 


sont constantes le long des solutions de (4.4). Par exemple, la dérivée du moment cinétique donne 


d | g192 o Q% 


En (a = qi) = V2 + Ga — (2V1 — QoU = VIVa — — === — VU] = 0 
dt VE + VE + 


Deuxième loi de Kepler. Ecrit en coordonnées polaires q) = rCos@, qo = rsin gp, gi = 
F COS Y — rýsin f, de = ù sin Y + rọ cos @, la formule pour le moment cinétique donne 


Lo = qido — Qå =... = r° 


ce qui démontre la deuxième loi de Kepler. 


Orbite elliptique. La formule pour le vecteur de Runge-Lenz-Pauli nous permet d’exprimer Lovi 
et Lovs en termes de qı et q2. Ces expressions, insérées dans Lo(qivo — qov1) = L donnent 


qı q2 
L =q (40 BS =) +Q (420 Sd -== ) = qÁ + g2A20 + 4/ +È. 
Vai + Vi + 


En sortant la racine et en prenant son carré, on obtient une équation quadratique pour (q1, q2), ce 
qui montre que l’orbite est bien une conique. 


VI4.3 Le système solaire (problème à /V corps) 


Le problème de Kepler traîte le mouvement d’une planète autour du soleil en tenant compte unique- 
ment de la force d’attraction entre le soleil et la planète. En utilisant les lois de Newton, on peut 
formuler sans difficulté les équations décrivant le mouvement en présence des plusieurs planètes. 
Il faut simplement additionner toutes les forces agissant sur un corps (voir la figure VIS). 


Figure VIS: Le système solaire avec les cinq planètes extérieures 
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En notant par q; € R? la position de la ième planète (qo € R? pour le soleil) et par m; sa 
masse, la loi d’attraction et la deuxième loi de Newton donnent l’équation differentielle 


nee DD Gmm rite ba (4.5) 


= 3? 
EE q;|l 


On peut de nouveau trouver quelques invariants (énergie totale, moment cinétique), mais ils ne 
suffisent pas pour pouvoir résoudre analytiquement ce problème. Pour prédire des eclipses du 
soleil ou la stabilité du système solaire sur des millions d’années, on est donc obligé d’utiliser des 
méthodes numériques (cours de deuxième année). Dans le paragraphe suivant nous allons étudier 
l existence et l’unicité de la solution d’une telle équation différentielle. 


VI.4.4 Réactions chimiques 


Considérons un mélange de trois substances chimiques qui réagissent selon les formules suivantes: 


A -5 B (lente) 
B+B — > C+B (très rapide) (4.6) 
B+C = A0 (rapide) 


Notons les concentrations de A, B et C par y1, y2 et y3. Une loi de la chimie (“differentiation 
law”) nous donne l équation différentielle 


A: yi = — 0.0dy + 10ty2y3 yı(0)=1 
B: y, = 0.04yı — 10fyzy3 — 3 : 10742 ya(0)=0 (4.7) 
C: y = 3- 10742 y3(0) = 0 


Elle est obtenue comme suit: pour chaque réaction on considère le produit des concentrations 
de substances apparaissant à gauche dans la formule chimique, on le multiplie par la constante 
décrivant la vitesse de réaction, et on ajoute ce produit avec le facteur k — £ à l’équation pour la 
substance D, si D apparaît k fois à droite et £ fois à gauche de la formule chimique. 

On a peu d’espoir de résoudre analytiquement ce problème et on est restreint à étudier des 
propriétés théoriques (existence, unicité de la solution, stabilité, ...). Pour obtenir des résultats 
quantitatifs, on est obligé d’utiliser des méthodes numériques. 


VIS Existence et unicité du problème de Cauchy 


Considérons le problème de Cauchy 


y = f(x,y), y(zo) = Yo (5.1) 


où f : U — R” (avec U C R x R” ouvert) est une fonction continue. En intégrant l’ équation 
différentielle entre x, et x on obtient l'équation intégrale 


2) =u+ | FOO) (52) 


Chaque solution de (5.1) est donc solution de (5.2). Le contraire est vrai aussi. Si une fonc- 
tion continue y(x) vérifie (5.2) sur un intervalle 7, alors elle est automatiquement continûment 
différentiable et elle vérifie (5.1). 
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L’équation (5.2) est sous la forme y = G{y) où pour une fonction y(x) donnée, G(y) est la 
fonction définie par le membre de droite de (5.2). Ceci suggère d’utiliser la méthode des approxi- 
mations successives. 


Rappel: la méthode des approximations successives. Pour résoudre un problème y = g(y) 
avec g : R — R, cette méthode est définie par: 


e on choisit yo arbitrairement, 
e on applique l’itération yg+ı = g(yx). 


Si cette itération converge, on est sûr d’avoir trouvé une solution (si 
g est continue). La solution n’est pas nécessairement unique. 
Prenons, par exemple, la fonction g(y) = cos y. Par le théorème 
des accroissements finis, on a |g(y) — g(z)| < yly — z| avec y = 
sin 1 < 1 (pour y, z € [0, 1}). Ceci permet de démontrer que {y;} est A de PA 
une suite de Cauchy et donc qu’elle converge (voir le petit dessin). mL Yo Y2 Yzy 


Itération de Picard-Lindelöf L’ équation (5.2) peut être considérée comme un problème à point 
fixe. L'idée est d’appliquer la méthode des approximations successives. Elle s’écrit sous la forme 


yolz) = Yo (ou une fonction arbitraire) 
T 


Y(t) = w+ f f(t yk(t)) dt. 


TO 


(5.3) 


Exemple 5.1 Considérons le problème 

y'=’,  y(0)=1 
avec comme solution exacte y(x) = 1/(1 + x). Les premières approximations obtenues par 
l’itération de Picard-Lindelôf sont yo(x) = 1, y(x) = 1 — x et y(x) = 1 — x + à? — x°/3 
(voir la figure VI.6). On observe une convergence rapide vers la solution exacte dans l’intervalle 
[0, 3.75]. Pour x trop grand, l’itération diverge. 


Figure VI.6: Itération de Picard-Lindelôf pour le problème de l’ Exemple 5.1 


Lemme 5.2 Soit A = { (x,y) E R x R” ; |x — zo| < a, lly — yol] < b}, f : A — R” une fonction 
continue et M = max( ea || f(x, y)||. Pour a := min(a, b/M), les fonctions y,(x) de l’itération 
de Picard-Lindelöf sont bien définie pour |x — xo| < a et elles satisfont 


lux(æ) — vol <b pour |z- zo| < a. 


Démonstration. L’ affirmation est obtenue par récurrence sur k comme suit 


[re v(t) dt] < [ire d<Mkr-æl<Ma<b o 


luee) — vol = | 
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On dit qu’une fonction f : À — R” (avec À comme dans le lemme précédent) satisfait une 
condition de Lipschitz si 


If y)— fœ 2) < Ly 21 pour (x,y), (x, z) € À. (5.4) 


La constante L s’appelle constante de Lipschitz. Remarquons que la condition (5.4) n’est pas une 
conséquence de la continuité de f(x, y). Par exemple, la fonction Vlyl est continue sans vérifier 
(5.4). D'autre part, chaque fonction qui est continâment différentiable vérifie (5.4). Ceci est une 
conséquence du théorème des accroissements finis (théorème IIL.5.1). 


Théorème 5.3 (existence et unicité du problème de Cauchy) Considérons l’ensemble 
A={(x,y)ER x R”; |z — zo| < a, |y — y < b} et supposons que f : À — R” 


e soit continue, 


è satisfasse une condition de Lipschitz. 


Alors, le problème de Cauchy y'= f(x, y), y(xo) = yo possède une solution unique sur 
I = [£o — à, £o + à}, où a = min(a, b/M) et M = max yen || f(x, y). 


Démonstration. Existence. L'idée est de démontrer que l’itération de Picard-Lindelôf converge 
uniformément sur J vers une solution du problème de Cauchy. Dans une première partie nous 
allons démontrer que 


ne 
memene ES 


DE pour |x — zo| < a. (5.5) 


Pour k = 0 avec pour yo(x) = yo, cette estimation suit de || f$ f(t, y(t))dt|| < M |z — xol. 
Supposons qu’elle soit vraie pour k — 1. Alors, on a pour £o < x < zo + Q que 


mac-an RICO OIRES eee) = ve II dé 


TO 


aus [UE ao vue 
ao kl (k +1)! 


IA 


(la démonstration pour £o — à < x < xo est analogue). 
De l’estimation (5.5) nous déduisons que {y,(x)} est une suite de Cauchy qui converge uni- 
formément. En effet, 


lYyr+m(£)— fr) < Yet) — Yrim1(t)] +--+ yeux) — ylz) | 
M (Lx — zo|)" +” (Lx — xo|)**! M (Lay) 


ce qui est le reste d’une série convergente. Donc, cette expression est plus petite que € si k est 
suffisamment grand. Comme la convergence est uniforme, la suite {y,(x)} converge vers une 
fonction continue y : Z — R” (théorème 1.5.1). 

Pour démontrer que cette fonction y(x) est une solution du problème de Cauchy, nous passons 
à la limite k — © dans (5.3). Comme {y;(x)} converge uniformément et f(x, y) satisfait la con- 
dition de Lipschitz (5.4), la suite { f(x, y.(x))} converge uniformément vers f(x, y(x)). On peut 
donc échanger la limite avec l’intégration dans (5.3) et on voit que y(x) est solution de l’équation 
intégrale (5.2). 
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Unicité. Supposons que y(x) et z(x) soient deux solutions sur J. Ceci implique que y(x) — 
z(x) = Saye) — f(t,z(t))) dt. On en déduit que ||y(x) — z(x)|| < 2M|zxz — zo|. Comme 
dans la première partie de la démonstration nous trouvons par récurrence que pour tout k > 0 


— xo|ë"t! _ 2M (Latt! 
= < 2ML" E zo| 


L (k+1)) 
I. 


IA 


La limite k — œ montre que ||y(x) — z(x) || = 0 pour tout x € 


VI.5.1 Prolongement des solutions et existence globale 


Le théorème 5.3 garantit l’existence locale d’une solution du problème de Cauchy. Si la fonction 
f(x,y) est continûment différentiable dans un voisinage de (xo, yo), le problème de Cauchy y’ = 
f(x,y), y(xo) = yo possède alors une solution unique sur [xro — &, xo + a| avec un a > 0. 
Considérons maintenant le point xı = zo + @, Yı = y(xo + à) sur cette solution. On peut 
réappliquer le théorème 5.3 au problème de Cauchy y = f(x,y), y(x1) = yı et ainsi prolonger 
cette solution. Jusqu’où peut on prolonger la solution de cette manière? 


Théorème 5.4 Supposons que la fonction f : U — R” (U un ouvert de R x R”) soit continûment 
différentiable sur U. Alors, 


e chaque solution de y' = f(x, y) peut être prolongée jusqu’au bord de U, 
e deux solutions de y' = f(x,y) ne s’intersectent jamais. 


La deuxième affirmation est une conséquence immédiate 
du théorème 5.3. La première est plausible mais nécessite 
quelques réflexions (ici, nous ne donnons pas de démonstration). 

Les affirmations du théorème peuvent être observées dans 
la figure pour l’exemple 2.1 du paragraphe VI.2. 


VI.6 Systèmes d’équations différentielles linéaires 
Dans ce paragraphe nous considérons des équations différentielles 


y = A(x)y + g(x) (6.1) 


où A(x) est une matrice n x n et g(x) est un vecteur. On dit que cette équation différentielle est 
homogène si g(x) = 0, sinon elle est irhomogène. 


Théorème 6.1 (existence globale et unicité) Soit I un intervalle (arbitraire) et supposons que 
A(x) et g(x) soient des fonctions continues sur I. Alors, le problème de Cauchy y = A(x)y+g(x), 
y(xo) = yo (avec zo € I et yo € R”) possède une solution unique sur tout l'intervalle I. 


Démonstration. La fonction f(x, y) = A(x)y+g(x) est continue sur I x R” et satisfait localement 
une condition de Lipschitz. La solution est donc unique là où elle existe. 

Pour démontrer l’existence globale, nous remarquons que les fonctions y(x) de la démonstration 
du théorème 5.3 sont définies sur tout l’intervalle 7 et pour tout k > 1. Pour un a arbitraire 
satisfaisant zo + à € 1, la démonstration du théorème 5.3 implique l’existence de la solution 
sur [£o, zo + a]. Il suffit de choisir M tel que || Le A(E)yo + g(t))dt| < Mix — zo| pour 
To < T < Xp +Q. 0 
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Théorème 6.2 (principe de superposition) Soit I un intervalle et soient A(x), g1(x), g2(x) des 
fonctions continues sur I. Si 


y:1—R" estsolutionde y = A(x)y + g(x), 


Y:1—R" estsolution de y = A(x)y + g(x), 
alors y(x) := ay1(x) + c2y2(x) est solution de 
y' = A(x)y+g(x) avec  g(x) := agi(x) + cogo(x). 


Démonstration. Ceci est un exercice très simple. m 


VI.6.1 Equations linéaires homogènes 


Même si la démonstration du théorème 6.2 est très simple, il a des conséquences très importantes. 
Nous notons par y(x, £o, yo) la solution du problème de Cauchy y’ = f(x,y), y(to) = yo. 
e les solutions de y’ = A(x)y forment un espace vectoriel; 


e les solutions de y’ = A(x)y dépendent linéairement de yo, c.-à-d., 
Y(T, Lo, C1Yo + €220) = C1Y (T, Lo, Yo) + C2Y (7X, Lo, Zo). 
La solution de y = A(x)y, y(£o) = yo peut donc être écrite sous la forme 
y(x, £o, Yo) = R(x, £o)yo, (6.2) 


et la matrice R(x, x0) s'appelle la résolvante de l équation différentielle y’ = A(x)y. La 
ième colonne de la matrice R(x, xo) est solution de y’ = A(x)y avec pour valeur initiale 
y(xo) = e; = (0,...,0,1,0,...0)5; 

e si P(x) est une matrice fondamentale (aussi appelée Wronskienne), c.-à-d., les colonnes de 
(x) sont des solutions de y = A(x)y et (xo) est inversible, alors 


R(x, to) = P(x)P(xo) t. (6.3) 
En effet, y(x) = P(x)P(x0o) ‘y est solution de y = A(x)y, y(xo) = Yo. 


Théorème 6.3 (propriétés de la résolvante) Soit A(x) continue sur un intervalle. Alors, la résolvante 
de y = A(x)y satisfait 


i) _R'(x,x0) = A(x)R(x, zo) (dérivée par rapport à x) 
ii) R(zo, to) = 1 (matrice identité) 
ii) R(x, to) = R(x, xı)R(z1, £0) 
iv) R(z,zo) estinversibleet R(x, xo) t = R(zo, £). 


Démonstration. Par (6.2) on a que R'(x, zo)yo = A(x) R(x, to)yo et R(zo, £o)yo = Yo pour tout 
Yo E R”. Ceci démontre les propriétés (1) et (11). La propriété (iii) est une conséquence du fait que 
R(x, £zo)yo et R(x, x1)R(x1, £o)yo sont solutions du même problème de Cauchy. Finalement, (iv) 
suit de (iii) en posant x = %o. m 
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Exemple 6.4 L’équation différentielle y” + y = 0 peut être écrite sous la forme (en posant yı = y 
et y2 = y’) 
JA 
V2 —1 0 Y2 


EAN ( cos(x — zo)  sin(x — zo) ) | 


— sin(x — zo) cos(x — xo) 


et possède comme résolvante 


Il est intéressant de voir que la propriété (iii) du théorème précédent, c.-à-d., 


cosa sing cos sng \  / cos(a+6) sinfa+ 8) 

—sina cosa —sinf cosĝjJ  \—sinfa+ p) cos(a + 8) 
avec & = x£ — æ1, O = £1 — To et a + 8 = x — qto, est équivalente au théorème d’addition pour 
sin + et cos 7. 


VI.6.2 Equations linéaires inhomogènes 


Considérons maintenant l’équation différentielle (6.1) où g(x) n’est pas nulle. Si l’on connait la 
résolvante de l’équation homogène, on trouve la solution du problème inhomogène par la méthode 
des variations des constantes. 


Théorème 6.5 (variation des constantes) Soient A(x) et g(x) continues sur un intervalle et soit 
R(x, xo) la résolvante de y = A(x)y. Alors, la solution de y = A(x)y + g(x), y(xo) = yo est 


donnée par 
T 


y(z) = R(œ, to) + | R(x, t)g(t) dt. 


TO 


Démonstration. La solution générale de l’équation homogène est R(x, xo)c avec c € R”. L'idée 
(d’où le nom “variation des constantes”) est de chercher une solution de y’ = A(x)y + g(x) sous 
la forme y(x) = R(x, xo)c(x). Il faut alors que 


y'(x) = R'{x, xo)c(x) + R(x, zo) (x) = A(x)R(x, xo)c(x) + g(x). 
En utilisant la propriété (1) du théorème 6.3, nous obtenons 
c'(x) = R(x, £0) 7 g(x) = R(xo,x)g(x) 


et par intégration c(x) = c(xo) + 1 R(xo.t)g(t) dt. L affirmation du théorème découle alors en 
insérant cette formule pour c(x) dans y(x) = R(x, xo)c(x). o 


Ce résultat montre que, comme dans le cas particulier de dimension 1, la solution générale de 
y = A(x)y + g(x) est composée de la solution générale de l’ équation homogène et d’une solution 
particulière de l’ équation inhomogène. Il reste alors à discuter le calcul de la résolvante R(x, xo). 
Pour le cas A(x) = A (matrice constante), ceci est le sujet du paragraphe suivant. Si A(x) dépend 
de x, le calcul analytique de la résolvante est rarement possible. 
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VI.7 Systèmes linéaires à coefficients constants 
Considérons le problème de calculer la résolvante de 
y = Ay (7.1) 


où A est une matrice constante d’ordre n (les a;; sont réels ou complexes). Motivés par la 
résolution de problèmes scalaires, essayons de trouver des solutions de la forme 


y(x) = ev avec un vecteur v Æ 0. (7.2) 


En insérant (7.2) dans (7.1) nous obtenons y'(x) = Àe"v = eò Av, ce qui est équivalent à 
Av = Àv. La fonction de (7.2) est alors une solution de (7.1) si et seulement si À est une valeur 
propre de À et v un vecteur propre correspondant. 


Cas 1 (A est diagonalisable) Dans cette situation, il existe n vecteurs propres indépendants 
V1,-.., Un avec Valeurs propres À1,....,À,. Considérons la matrice 


(x) = (ex, ee cie). (7.3) 


Cette matrice est inversible pour tout x car ®(0) l’est. La résolvante est alors donnée par R(x, £o) = 
P(x)P(xo) ! (voir l’équation (6.3)) ou aussi par R(x, £o) = P(x — r9)P(0) À. 


Cas 2 (A n’est pas diagonalisable) L’idée est de transformer A sous une forme “plus simple”, 
par exemple sous forme triangulaire (voir le paragraphe II.2) ou sous forme de Jordan (voir le cours 
“Algèbre I”). On cherche alors une matrice inversible U telle que U-!AU = S possède une telle 
forme. Avec la transformation y = Uz (et y = Uz') le système (7.1) devient z/ = Sz. Pour le cas 
d’une matrice triangulaire on a 


R = 
21 = 81121 + S1222 + ... + Sinn 
1 

Zo = S2222 T ... + Son2n 
fes = 

Rd Snn?n 


On résoud d’abord l’équation différentielle pour zn, ensuite celle pour z,_ et à la fin celle pour 
zı. La solution de (7.1) est obtenue par y(x) = Uz(x). 


Exemple 7.1 Considérons un bloc de Jordan de dimension 4 


A 1 
A 1 
À 1 

À 
Pour la solution de 2’ = Jz on commence par z4; on trouve z4 = Àz et z4(x) = ec4. L’équation 
différentielle pour z3 est 2, = Àz3 + ec4. Sa solution est z3(x) = ec + rec4. De la même 
façon on calcule (x) et (x). Le résultat est 


nl 

1 æ æ! 
1 T 
1 


z(0). (7.4) 


z(x)=e 
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Figure VI.7: Solutions de systèmes linéaires en dimension 2 


Exemple 7.2 Dans la dimension 2, les solutions y(x) de l’ équation différentielle y’ = Ay peuvent 
être dessinées comme courbes avec x comme paramètre. Le comportement des solutions (pour 
quelques matrices) est illustré dans la Fig. VI.7. Dans les dessins (a), (b) et (e) les directions des 
vecteurs propres sont indiquées par des flèches. 

a) deux valeurs propres distinctes et réelles, 

b) une valeur propre de multiplicité deux, seulement un vecteur propre, 

c) les valeurs propres sont complexes conjuguées avec RA; > 0, 

d) une valeur propre de multiplicité deux, mais deux vecteurs propres indépendents, 

e) les valeurs propres sont réelles de signe opposé, 


f) les deux valeurs propres sont sur l’axe imaginaire. 


VIS Exercices 


Chapter VII 


Séries de Fourier 


La théorie de ce chapitre nous permet de mieux comprendre toute sorte de phénomènes pério- 
diques. Une grande partie de la présentation, des remarques historiques et des figures illustratives 
a été empruntée (avec permission) de l’excellent polycopié “Analysis II. Pars A” de Gerhardus 
Wannerus (anno MMI/MMIT). 

L'étude de la propagation des ondes dans une corde vibrante (Taylor 1713, Joh. Bernoulli 1727, 
Euler 1739) ou dans l’air (théorie du son de Lagrange 1757) ainsi que l’interpolation de fonctions 
périodiques en astronomie (Euler 1753) étaient à l’origine de cette théorie. Le livre qui a donné le 
nom au chapitre est la Théorie analytique de la Chaleur de Joseph Fourier. Un premier manuscript 
a été présenté par Fourier à L’ Académie en 1807, un second en 1811 et le livre a finalement 
été publié en 1822. L'importance de cette œuvre est exprimée par la phrase “FOURIERS Théorie 
analytique de la Chaleur ist die Bibel des mathematischen Physikers” dans un livre de Sommerfeld 
(1947). 

Comme exemple, considérons la digitalisation d’un son (figure VIL.1). On a enregistré 22 000 
impulsions par seconde, dont 1024 sont dessinées (ceci correspond à 1024/22 ~ 46.5 milli- 
secondes). On est souvent intéressé par l’étude du spectre d’un tel signal, par les fréquences 
dominantes, par la suppression d’un bruit de fond éventuel, etc. 


l l l l | l l 
0 100 200 300 400 500 600 700 800 900 1000 


CPR 


Figure VII.1: Digitalisation du son “o” prononcé par Martin 


Aujourd’hui, on utilise des séries de Fourier (sa version discrète FFT, voir le cours “Anal- 
yse Numérique”, un autre des “Top 10 Algorithms of the 20th Century”) et des modifications 
(wavelets) dans beaucoup d’applications en informatique (compression de sons, compression d’image). 


VIL1 Définitions mathématiques et exemples 


Fonctions périodiques. Les fonctions sin x, cos x, mais aussi sin 2x, cos 5x sont des fonctions 
27-périodiques, c.-à-d. elles vérifient la relation 


f(x + 2r) = f(x) pour tout x € R. 
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Polynômes trigonométriques. Les combinaisons linéaires de sin kz et de cos kx (k € Z) sont 
des fonctions 27-périodiques. Elles sont de la forme 


N N 
a f 
a + > ay cos kx + 2 bg sin kz, (1.1) 


où les az et by sont des coefficients réels. On appelle (1.1) un polynôme trigonométrique. 


—0.15 + 0.4cosx +0.6sinmx ...— 0.5cos 2x — 0.4 sin 2z ... + 0.25 cos 3x — 0.5 sin 3x 
TE 


Figure VII.2: Plusieurs polynômes trigonométriques 


Formule d’Euler et représentation complexe. La formule ď’ Euler 


e = cos x +isinr (1.2) 


nous permet de simplifier l'expression (1.1). En effet, en additionnant et en soustrayant la formule 
(1.2) et e™ = cos (—x) + isin (—x) = cos x — isin x, on en déduit 


COST = ————, sint = ———. (1.3) 


Le polynôme trigonométrique (1.1) peut donc être écrit sous la forme 


N 


diner (14) 


k=—N 


il ; = 
Ck = 5(ak = ibg) N st Ak = Ck + C-k 
i i ou, de manière équivalente, $ 
C-k = >(a + ibg) bk E i(cy = cg). 


Avec ces formules, on peut passer de la représentation réelle (1.1) à la représentation complexe 
(1.4) et vice-versa. 


Coefficients de Fourier d’une fonction 27-périodique. Considérons d’abord un polynôme 
trigonométrique f(x) = 3_}__ y cke”, multiplions-le par e—Ÿ# et intégrons de 0 à 2r: 


27 N 27 
0 k=-N 0 


car 1 eine dx = Lee = 0 pour m Æ 0 est égal à 2x pour m = 0. On obtient alors 


i 
Ck = + 4 fer ™ da 


ak = Ck + C-k = L f(x) cos kz dx (1.5) 
bk = i(Ck — C-k) = LE f(x) sin kx dx. 


; Led P 2 ; 2 
Comme les fonctions sont 27-périodiques, on peut écrire f a ou J; T4 au lieu de R i 


Si f(x) est 27-périodique, mais pas nécessairement un polynôme trigonométrique, on appelle 
(1.5) les coefficients de Fourier de la fonction f(x). 
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Série de Fourier associée à une fonction périodique. Soit f(x) une fonction 27-périodique 
telle que les intégrales dans (1.5) existent. On appelle “série de Fourier de f(x)” la série 


, i ga . 
`r cpet? où ëj a faje ™ dx (1.6) 
2T 0 
keZ 
et on écrit f(x) ~ pez cke™”. La série de Fourier peut également être écrite sous la forme 
FX) ~ ao/2+ 5 32 ax cos kx + 5°, br sin ke avec ag, by donnés par (1.5). 


Pour le moment, on sait seulement qu’on a égalité dans f(x) = Jpeg re" pour des 
polynômes triogonométriques. On ne sait pas si cette identité reste vraie pour des fonctions 2r- 
périodiques arbitraires. On ne sait même pas si la série (1.6) converge. Le sujet de ce chapitre est 
d'étudier cette sorte de questions. 


Exemple 1.1 Étudions comment une fonction f(x) est approximée par sa série de Fourier. La 
figure VIL3 montre six fonctions 27-périodiques ainsi que plusieurs troncatures de leurs séries de 


Fa 


—2— 
= 1 di 
y = cos x + 3 COS 3T zg COS LE +... 


—2— 
y = cos x — cos 2x + à cos 37 — ... y = cos x — 4 cos 2x + à cos 37 — ... 


=] 


-1 
3 


= sinz 4 i Lai Siea = = 2 = 
y =sinT sin 3x + 5 sin 97 +... y = ls cos 2x — x5 COs 4r — zz COs 6T — ... 


Figure VII.3: Quelques fonctions 27-périodiques avec des séries de Fourier tronquées associées 
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Fourier associées. Les six fonctions sont: 


V2cos2x si [x] < 7/4 


f(x) = 0 si 7/4 < || < 37/4 fe)=5 si |z| <r 
—V2cos2x si 3r/4< |r| <r 
J y2 
eo si |z| <r f(æ) = log(2cos =) si [xl <r 
f 7/4 si 0<x<7 Due 
Ce Er Green f(x) = ;1snxl 


Vérifions, par exemple pour la fonction f(x) = x/2 (|x| < 7), que la série de Fourier est celle 
donnée dans le dessin correspondant de la figure VIL3. Un calcul direct donne: 


1 T 
ak = — | Z cos kx dz = 0 (parce que x cos kx est impaire), 
T Jr 
1 f 1 kz |T 1 f AP 
bk = F Z sinke de = =(- — 2 se + z f coskede) = =a 
Remarquons que, en général, on a 
e a, = 0 si la fonction f(x) est impaire, c.-à-d. si f(—x) = — f (x) (série de sinus), 


e by = 0 si la fonction f(x) est paire, c.-à-d. si f(—x) = f(x) (série de cosinus). 


Exemple 1.2 Étudions encore la fonction du début de ce chapitre qui est la digitalisation d’un 
son (figure VIL.1). Sur l’intervalle comprenant tous les 1024 points elle n’est visiblement pas 
périodique. Par contre, les premiers 944 points représentent une fonction qui peut être prolongée 
périodiquement. Sa période est T = -%4 secondes. Si on dénote le polygône passant par ces 
points par F(t) (t en secondes), la fonction f(x) = F(t) avec x = 2rt/T devient 2r-périodique 


et on peut appliquer les formules de ce paragraphe. On cherche donc une représentation 


. 27Tt 
F(t) = De avec £= aa 
keZ 


La figure VII.4 montre les modules de cą en fonction de k. On les calcule numériquement par 
FFT, voir le cours “Analyse Numérique”. Comme f(x) est réelle, on a c- = Tk. On observe 
que les coefficients de Fourier dominants correspondent tous à des multiples de 5. La fréquence 
dominante de ce son est donc de 5/T = 5 - 22 000/944 ~ 116.5 Hz. 


101} 
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ni 


100 150 
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Figure VII.4: Le spectre (valeur absolue de c; en fonction de k) pour le son de la figure VIL.1 
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Ck [cp] 
5.61— 0.35: 5.62 
4.27 — 8.711 9.70 

—13.53 + 12.821 18.64 


Ck A 

9.45 — 1.934 9.78 
0.31 — 1.19: 1.23 
— 7.84 — 2.181 8.14 


Table VII.1: Coefficients de Fourier pour le son de la figure VII.1 


Essayons de retrouver le son de la figure VII.1 à partir de son spectre (c.-à-d. à partir des 
coefficients de Fourier c;). Quelques valeurs de c sont données dans le tableau VIL1. Dans la 
figure VILS nous dessinons quelques séries de Fourier tronquées. D’abord nous prenons unique- 
ment les termes avec k = +15 et k = —15, c.-à-d. la fonction c_15e 5% + cel, Ceci donne la 
fonction pointillée dans la figure VILS (un sinus pur). Si on tient en plus compte des coefficients 
avec k = +10 et k = +30 on obtient la fonction traitillée, et en ajoutant les termes correspondant 
à k = +5 et k = +20 on obtient la courbe solide. Elle est déjà une très bonne approximation du 
son actuel. On voit qu’avec très peu d’information on peut reconstituer le signal original. 


ARRET ln jeta Hs ARRET Lirras Livriissis Lornas CARE RARE ÉRRTR ee Lu 
0 100 200 300 400 500 600 700 800 900 1000 


Figure VII.5: Approximation par un polynôme trigonométrique 


VII.2 Etude élémentaire de la convergence 


Une première approche pour étudier la convergence de la série de Fourier associée à une fonction 
2r-périodique consiste à dériver des majorations pour |c4| et d'utiliser le fait que |cpet®| < |c]. 
Un premier résultat est le suivant: 
Lemme 2.1 (lemme de Riemann) Si f : |a, b] — R est intégrable (au sens de Riemann), alors 
b b 
lim | f(x) sin kz dx = 0 et lim / f(x)cos kx dx = 0 
k> Ja k> Ja 


(sans démonstration). 
Ce lemme implique que les coefficients de Fourier satisfont toujours 
ak — 0, bg — 0 et Ck — 0. 


L'hypothèse sur l’intégrabilité de la fonction f(x) est nécessaire car, sinon, les coefficients de 
Fourier n’existeraient pas. Une definition utile pour estimer les coefficients de Fourier est: 


Définition 2.2 Pour une fonction f : [a,b] — R on définit sa variation totale par 
n—1l 
Vanf= sp (X em) - fl). 
A=TO<TI <...<En=b 5=0 


On dit que f est à variation bornée si Vin f < œ. 
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Afin de mieux comprendre cette définition, voici quelques propriétés de fonctions à variation 
bornée: 


o Si f : [a,b] — R est à variation bornée, alors f est intégrable (au sens de Riemann). 
Pour une division D = {a = zo < £1 < ... < x, = b}, la différence entre la grande et la 
petite somme satisfait (voir les pages 222 et 226 du livre “L'analyse au fil de l’histoire”) 


n—1 


S(D)-s(D) = `` aa |f) — F) (ti — xi) 
j=0 VER Titi 
n—1 


< `> sut (iri — ti) < Vanf max: |ti+1 — Ti 
E 2 


qui converge vers zéro Si MAX;_0..n—1 |Zi+1 — Li] — 0. 


è Si f est continûment différentiable, alors f est à variation bornée. 
Sur l'intervalle compact [a, b] on a | f'(x)| < M. Le théorème de Lagrange nous donne alors 


n—1 n—1 
>. (ain) — fal = ` IED £i = vil < Mb — a). 
i=0 i=0 

e Une fonction f peut être à variation bornée sans être continue. 


Considérons, par exemple, des fonctions en escalier. 


e Une fonction f peut être continue sans être à variation bornée. 
Une exemple est la fonction f(x) = x sin(1/x) sur l'intervalle [0, 1]. 


Théorème 2.3 Si f : [0,27] — R est à variation bornée, alors 


Const 
[k] 


lek] < (de même pour ax, bp ). (2.1) 


Si f : R —> R est 2r-périodique et p fois différentiable avec fP |0,2] à variation bornée, alors 


Const 


lc| < 
Démonstration. Commençons à démontrer l affirmation (2.1) pour 
des fonctions en escalier (voir le petit dessin). On peut explicitement 
calculer les coefficients de Fourier et on obtient 


1 27 . 1 n zj E 
G À s(x) e™™ i= Du | e KE dx 
j=1 j—1 
(= rik Yı e Y2 yı e Y3 Y2 RES Un ; 
1 Const 
HE: z (Von + Is(2r) — s(0)1) < A, 


Soit maintenant f(x) une fonction arbitraire à variation bornée. Elle est alors intégrable et, par 
définition de l'intégrale de Riemann, il existe une fonction en escalier s(x) satisfaisant Vio 27]S + 


|s(27) — s(0)| < Voznf + |f (27) — £ (0)|, tel que ff” s(x) e™™" dx est arbitrairement proche du 
coefficient de Fourier [97 f(x) e™™” dx de f(x). Ceci démontre (2.1). 
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Si f(x) est une fois différentiable, une intégration par partie donne 


ekz 27 1 


l j —ikx l m ! —ikx 
asg [fe de= ta) l tgz Od 


et on peut appliquer (2.1) à f'(x). Plusieurs intégrations par parties donnent (2.2). m 


La deuxième et la cinquième fonction de la figure VIL3 sont à variation bornée, mais elles 
ne sont pas continues sur tout l’intervalle. On comprend alors pourquoi les coefficients de Fourier 
diminuent comme Const/k. La quatrième fonction n’est pas bornée et donc pas à variation bornée. 
Cela n’empêche pas les coefficients de diminuer aussi comme Const/k. 

La troisième et la sixième fonction de la figure VIL.3 possèdent une première dérivée qui est à 
variation bornée, d’où un comportement en C'onst/k?. La première fonction est à variation bornée, 
mais sa dérivée ne l’est pas. On peut démontrer (par le produit de Wallis) que les coefficients de 
Fourier se comportent comme Const/kt5. 

Concernant la convergence d’une série de Fourier, le théorème précédent nous permet de 
déduire le suivant: si f(x) est 27-périodique avec une dérivée à variation bornée, alors les coeffi- 
cients de Fourier satisfont |c,| < Const/k?. Le critère de Weierstrass montre donc la convergence 
uniforme de la série 9°, cpet. Jusqu’ à maintenant on ne sait rien sur la convergence si les coef- 
ficients se comportent comme Const/k. Dans le cas où la série converge, on ne sait pas encore si 
elle converge vers la fonction f(x). Ces questions nous occuperont dans le paragraphe suivant. 


VIL3 Noyau de Dirichlet et convergence ponctuelle 


Pour étudier la convergence de la série de Fourier associée à une fonction f(x), nous considérons 
les sommes partielles 


Sr) ce rt où C = L z ze 4 dz. 
(x) » k =z, J(x) 
Nous nous posons les questions suivantes: 
e Pour quelle fonction f(x) et pour quelle valeur de x, la limite limp—oo S,(x) existe-t-il? 
o Cette limite, est-elle égale à f(x)? 


Commençons par calculer cette somme partielle: 


ACER 2 Pi ae dt- e™ = We `> e = "p (x —t)f(t)dt 
jen 27 Jo 0 aE 0 


eY 


ou 


1 kas 
D, (x — t) := D >» ent) (3.1) 
|k|<n 


est le noyau de Dirichlet. Des formules plus simples sont données dans le lemme suivant. 


Lemme 3.1 Le noyau de Dirichlet est donné par 


_ 1 sn(n+1/2)s 
PRE 2x  sins/2 Ga 


et la somme partielle de la série de Fourier satisfait 


Sus i (FC + 5) + f — s)) Dals) ds. (3.3) 
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Figure VIL.6: Noyaux de Dirichlet D, (s) 


Démonstration. En écrivant (3.1) comme une série géométrique, on obtient avec la formule d’Euler 


2r D (s) — e"s (1 Leis + e2is à | ere) _ Qins Den 
á .. i = Z 
e™ins — em+1)s e(n+1/2}s - eitn+1/2)s PA (a f 1/2)s 
] — ets e7is/2 — eis/2 in 5/2 
La formule pour la somme partielle est donnée par le calcul suivant: 
a F(t) D, (x — t) dt = ES n(s) ds = flo) ds 
27 na 


T 


= [re-9D, (s) ds + [re -9p Ads = [re +s) + Fle — s)) Dals) ds. 


Dans la première ligne on a utilisé la 2x-périodicité de D„(s) et de f(x — s) et dans la deuxième 
ligne le fait que Dp (s) = D,(—s). m) 


Théorème 3.2 (Dirichlet 1829) Soit f(x) 2r-périodique, f|10,2A à variation bornée et supposons 
qu’en chaque point xo de discontinuité les limites f(xo—) et f(xo+) existent. Alors la série de 
Fourier converge pour tout xo € R et 

e si f est continue en zo, on a liMp—oo Sn(to) = (To), 

e si f est discontinue en £o, on a 


, 1 
Em Sato) => (F@-) + [(&o+)) (3.4) 
(le premier cas est en fait un cas particulier du deuxième). 


Démonstration. Pour simplifier la démonstration, supposons que f(x) INTO) 
soit différentiable dans un voisinage de gauche et de droite de x, (voir le en 
petit dessin). Ceci implique que f (xo +s) — f(x) = sg(s) pour s > 0 4 
avec une fonction g(s) bornée sur s > i 
Nous utiliserons la propriété h DP n(s)ds = 1/2 du noyau de Dirichlet qui est une conséquence 
de D,(—s) = D,(s)etde f7, Dhs) ds = STs E Epen e ds = 1. 
La formule (3.3) nous suggère considérer l’expression 


0 T 


T 


T f (zo + s)PA(s) ds Ea J f (Feot 9- FET) Dads E | sstD(s) as 


T 7 i 
= fs ED sin ((n + 1/2)s)ds — 0. 
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La fonction g(s)s(sin(s/2))"? étant bornée sur l'intervalle [0, 7], le lemme de Riemann implique 
que cette expression tend vers zéro pour n — oo. 
De la même manière, on démontre 


f te — s) Da (8s) ds — a — 0 


et en utilisant la formule (3.3) on en déduit (3.4). (m| 


VII.4 Convergence en moyenne quadratique 


Rappelons qu’un polynôme trigonométrique de degré n, est une fonction 
T, (£) = D» cpet? (= S + S (a cos kx + by sin ka)) ; 
|k|<n k=1 
Le problème que nous nous posons dans ce paragraphe est le suivant: 


Problème. Soit f(x) une fonction 2r-périodique. Trouver le polynôme trigonométrique de degré 
n tel que 


1 E EEA 


Pour résoudre ce problème, nous le reformulons afin de pouvoir appliquer les techniques du 
chapitre IV. Nous posons cg = az + i5, et la fonction à minimiser devient 


27 
F(Qn; B-n- - -; On, Bn) = f (f(x) = ` (ax + ire") TE — X (a — iði) dx 
o |k|<n <n 
Une condition nécessaire est que toutes les dérivées partielles soient nulles, c.-à-d. 
27 e a [FI —ilx 27 iki Siig 
Jaz) = o E (7G) — Ein GE +) de - 0 COA Een Je 1? dx 
..=— ( S f(x) é dx — 2n77) — ( o" f(x)e ge 2nc;) =0 
AA = He ( o" F(x) et dx ic) +i ( oT f(x)e ijs dg — 2nc;) = (0% 


Comme F est une fonction quadratique, il n’est pas difficile de calculer sa deuxième dérivée (ma- 
trice Hessienne) qui est la matrice identité multipliée par 4r. On a alors démontré le théorème 
suivant: 


Théorème 4.1 La série de Fourier tronquée 5, (x) est parmi tous les polynômes trigonométriques 
T (x) de degré n celui qui minimise l'intégrale 


1 If) = TP de. 


Théorème 4.2 Soient f(x) continue par morceaux et S, (x) la série de Fourier tronquée. Alors 


27 


lim |f(x) — S,(x)l dx = 0. 


n— CO 0 
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Démonstration. Si f(x) est un polynôme trigonométrique, disons de degré 1000, alors S,(x) = 
f(x) pour n > 1000 d’après le théorème précédent et l’affirmation est démontrée. 

Pour le cas général, on utilise le théorème de Weierstrass (sans démonstration), qui dit: pour 
tout € > 0, il existe un polynôme trigonométrique 7, (x) tel que | f(x) — T,(x)| < € sur [0, 27]. 
Nous ne donnons pas de détails de la démonstration. m 


Théorème 4.3 Soit f(x) intégrable sur |0, 27] et supposons que Pa |f (x)|? dx < œ. Les coeffi- 
cients de Fourier cg = + = f(x)e™™" dx satisfont alors pour tout n 


1 27 
D» lcl? < =f | f(x)? dz (inégalité de Bessel) . 
k|£n Fap 
Si, en plus, f (x) est continue par morceaux alors 
27 
y lc|? = F |f (£)? dx (identité de Parseval) . 
keZ 


Démonstration. Calculons 


0 < NIFE) - Se) de = fo” - C spra] z 2 ae") da 
E 1 f(x) dx — Due Ck na e*t dx — Den à c E: e dx + 2r D he x | 
£ Pa f(x)P? dx — DR CRTC — _. G2rCQ + 27 À Hé . 
= fo” F(E)? de — 27 Een ler? - 

L'identité de Parseval est maintenant une conséquence du théorème précédent. o 
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